Anda di halaman 1dari 107

i

ii
iii
KATA PENGANTAR

Puji syukur penulis panjatkan kehadirat Allah SWT, karena atas segala
nikmat dan karunianya yang telah memberikan kesempatan, kesehatan dan
kemudahan kepada penulis sehingga akhirnya dapat menyelesaikan Skripsi ini
dengan baik. Tersusunlah Skripsi yang berjudul “PERANCANGAN DATA
MINING UNTUK KLASIFIKASI DALAM PREDIKSI PENYAKIT ISPA
PADA BALITA DENGAN ALGORITMA C4.5”.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam


rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer
(S.Kom.) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi
Pelita Bangsa. Selama proses pengerjaan Skripsi ini tidak sedikit kendala yang
penulis hadapi akan tetapi penulis selalu berusaha untuk memberikan yang
terbaik.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan
ucapan terima kasih yang sebesar-besarnya kepada:

1. Bapak Dr.Ir. Supriyanto, M.P. selaku Ketua STT Pelita Bangsa Cikarang.
2. Bapak Aswan Supriyadi Sunge, S.E, M.Kom selaku Ketua Program Studi
Teknik Informatika STT Pelita Bangsa.
3. Bapak Donny Maulana, S.Kom, M.MSi selaku pembimbing utama yang
telah banyak memberikan arahan dan bimbingan yang sangat berarti kepada
penulis, dalam penyusunan Skripsi ini dengan sebaik-baiknya.
4. Bapak Agus Suwarno, S.Kom, M.T. selaku pembimbing kedua yang telah
banyak memberikan arahan dan bimbingan yang sangat berarti kepada
penulis, dalam penyusunan Skripsi ini dengan sebaik-baiknya.
5. Seluruh Dosen Sekolah Tinggi Teknologi Pelita Bangsa yang telah membekali
penulis dengan wawasan dan ilmu di bidang teknik informatika.

iv
v
DAFTAR ISI

PERSETUJUAN.......................................................................................................i
PENGESAHAN.......................................................................................................ii
PERNYATAAN KEASLIAN PENELITIAN........................................................iii
KATA PENGANTAR............................................................................................iv
DAFTAR ISI...........................................................................................................vi
DAFTAR TABEL.................................................................................................viii
DAFTAR GAMBAR..............................................................................................ix
DAFTAR LAMPIRAN............................................................................................x
ABSTRAK..............................................................................................................xi
ABSTRACT.............................................................................................................xii
BAB I PENDAHULUAN........................................................................................1
1.1 Latar Belakang Masalah...............................................................................1
1.2 Identifikasi Masalah.....................................................................................4
1.3 Batasan Masalah...........................................................................................5
1.4 Rumusan Masalah........................................................................................5
1.5 Tujuan Penelitian.........................................................................................5
1.6 Manfaat Penelitian.......................................................................................5
1.6.1 Manfaat Bagi Penulis........................................................................5
1.6.2 Manfaat Bagi Masyarakat.................................................................6
1.6.3 Manfaat Bagi Program Studi Teknik Informatika............................6
1.6.4 Manfaat Bagi Tenaga Medis Kesehatan...........................................6
1.7 Sistematika Penulisan...................................................................................6
BAB II TINJAUAN PUSTAKA..............................................................................8
2.1 Penelitian Terdahulu....................................................................................8
2.2 Tinjauan Teori..............................................................................................9
2.2.1 Pengertian Data Mining...................................................................9
2.2.2 Pengertian Klasifikasi....................................................................10
2.2.3 Pengertian Pohon Keputusan (Decision Tree)...............................11
2.2.4 Kelebihan Decision Tree................................................................12
2.2.5 Kekurangan Decision Tree.............................................................12
2.2.6 Pengertian Algoritma C4.5.............................................................13
2.2.7 Kelebihan C4.5...............................................................................16
2.2.8 Kekurangan C4.5............................................................................16
2.2.9 Pengertian ISPA.............................................................................16
2.2.10 Pengertian ISPA Non Pneumonia(ISPA Ringan)........................17

vi
2.2.11 Pengertian ISPA Pneumonia(ISPA Sedang/Berat)......................18
2.2.12 Penyebab Terjadinya ISPA..........................................................19
2.3 Kerangka Pemikiran...................................................................................21
BAB III METODE PENELITIAN.........................................................................23
3.1 Objek Penelitian.........................................................................................23
3.1.1 Profile Puskesmas Mekarmukti......................................................23
3.1.2 Visi Misi Perusahaan......................................................................24
3.2 Peralatan Yang Digunakan.........................................................................24
3.3 Tahapan Penelitian.....................................................................................25
3.4 Tahapan Analisa Data................................................................................27
3.5 Metode Yang Diusulkan............................................................................28
3.6 Pengumpulan Data.....................................................................................28
3.6.1 Pengelolaan Data Awal.................................................................30
BAB IV HASIL DAN PEMBAHASAN...............................................................39
4.1 Hasil Penelitian..........................................................................................39
4.1.1 Evaluasi dan Validasi hasil Algoritma C4.5..................................39
4.1.2 Perhitungan Algoritma C4.5..........................................................39
4.1.3 Pengelolaan Dataset.......................................................................43
4.1.4 Menghitung Entropy Split Dataset.................................................52
4.2 Pembahasan................................................................................................52
BAB V KESIMPULAN DAN SARAN.................................................................54
5.1 Kesimpulan................................................................................................54
5.2 Saran...........................................................................................................54
DAFTAR PUSTAKA............................................................................................55
LAMPIRAN...........................................................................................................58

vii
DAFTAR

Tabel 3.1 Tabel Daftar Penyakit ISPA....................................................27


Tabel 3.2 Tabel Gejala Penyakit ISPA....................................................27
Tabel 3.3 Dataset Penyakit ISPA............................................................29
Tabel 3.4 Pemilihan Data.........................................................................30
Tabel 3.5 Umur........................................................................................32
Tabel 3.6 Berat.........................................................................................32
Tabel 3.7 Batuk........................................................................................32
Tabel 3.8 Flue..........................................................................................33
Tabel 3.9 Demam.....................................................................................33
Tabel 3.10 Nafas Berat............................................................................33
Tabel 3.11 Tenggorokan Merah...............................................................33
Tabel 3.12 Status Gizi..............................................................................34
Tabel 3.13 Lingkungan Rokok................................................................34
Tabel 3.14 Proses Cleaning Data.............................................................34
Tabel 3.15 Confusion Tabel.....................................................................37
Tabel 4.1 Entropy Total...........................................................................39
Tabel 4.2 Perhitungan Pohon Keputusan Menentukan Nood(Akar).......40
Tabel 4.3 Nilai Gain Pada Cabang Umur................................................41
Tabel 4.4 Nilai Gain Pada Cabang Lingkungan Rokok...........................41
Tabel 4.5 Nilai Gain Pada Cabang Batuk................................................41
Tabel 4.6 Nilai Gain Pada Cabang Nafas Berat.......................................41
Tabel 4.7 Nilai Gain Pada Cabang Berat.................................................41
Tabel 4.8 Nilai Gain Pada Cabang Tenggorokan Merah.........................42
Tabel 4.9 Nilai Gain Pada Cabang Batuk................................................42
Tabel 4.10 Nilai Gain Pada Cabang Umur..............................................42
Tabel 4.11 Perhitungan Akhir Entropy dan Gain....................................42
Tabel 4.12 Rule Klasifikasi Prediksi........................................................50
Tabel 4.13 Hasil Penelitian......................................................................52

v
DAFTAR

Gambar 2.1 Kerangka Pemikiran.............................................................22


Gambar 3.1 Tahapan Penelitian...............................................................26
Gambar 3.2 Langkah Pengujian Metode.................................................28
Gambar 3.3 Representasi 10 Fold Cross Validation...............................36
Gambar 4.1 Read Excel...........................................................................43
Gambar 4.2 Pemilihan Dataset................................................................44
Gambar 4.3 Pemilihan Hasil Keputusan Sebagai Tabel(Dataset)...........44
Gambar 4.4 Model Cross Validation dengan Decision Tree C4.5..........45
Gambar 4.5 Start The Execution.............................................................46
Gambar 4.6 Hasil Accuracy Decision Tree C4.5.....................................46
Gambar 4.7 Hasil Recall Decision Tree C4.5..........................................47
Gambar 4.8 Hasil Precision Decision Tree C4.5.....................................47
Gambar 4.9 Hasil AUC (Area Under Curve) Decision Tree C4.5..........48
Gambar 4.10 Meta Data View (Dataset).................................................49
Gambar 4.11 Permodelan Pohon Keputusan Algoritma C4.5.................50

i
DAFTAR

Lampiran 1 Lampiran Dataset Keseluruhan Penyakit ISPA...................59


Lampiran 2 Lampiran Hitungan Manual Decision Tree C4.5.................63

x
ABSTRA

Infeksi saluran pernafasan akut (ISPA) adalah penyakit infeksi akut yang
menyerang salah satu bagian dan atau lebih dari saluran nafas mulai dari hidung
(saluran atas) hingga alveoli (saluran bawah) termasuk jaringan adneksanya,
seperti sinus, rongga telinga tengah dan pleura. ISPA dapat dibedakan menjadi
dua macam, terdapat ISPA non pneumonia yang dikenal oleh masyarakat dengan
istilah batuk pilek sedangkan ISPA pneumonia terjadi apabila batuk pilek
disertai dengan gejala lain, kesukaran bernapas, peningkatan frekuensi napas
(napas cepat). Perlu adanya pengklasifikasian jenis penyakit ISPA non
pneumonia ataupun pneumonia untuk mengetahui akurasinya. Pengujian yang
dilakukan terhadap 160 data menggunakan confusion matrix dan ROC curve
menghasilkan tingkat keakuratan sebesar 0.790% dengan +/-0.153% serta mikro
0.790%. Jika melihat dengan kurva ROC menggunakan dataset dengan akurasi
fair classification sebesar 0.790. Nilai keakuratan tersebut dapat dikatakan
cukup untuk digunakan dalam memprediksi jenis penyakit ISPA.

Kata kunci: algoritma C4.5, Data Mining, ISPA

x
ABSTRACT

Acute respiratory tract infection (ARI) is an acute infectious disease that


attacks one part and or more of the respiratory tract starting from the nose
(upper channel) to the alveoli (lower channel) including its adnexal tissue, such
as the sinuses, middle ear cavity and pleura. ARI can be divided into two types,
there is a non-pneumonia ARI that is known by the public with the term cold
cough while ARI pneumonia occurs when a cold cough is accompanied by other
symptoms, difficulty breathing, increased frequency of breathing (rapid
breathing). There needs to be classification of non-pneumonia ARI or
pneumonia to find out its accuracy. Testing conducted on 160 data using
confusion matrix and ROC curve resulted in an accuracy rate of 0.790% with
+/- 0.153% and micro 0.790%. Looking at the ROC curve using a dataset with
fair classification accuracy of 0.790. The value to accuracy can be said to be
sufficient to be used in predicting the type of ARI.

Keywords: C4.5 algorithm, Data Mining, ARI

x
BAB I

PENDAHULUAN

1.1 Latar Belakang Masalah


Infeksi saluran pernafasan akut (ISPA) adalah penyakit infeksi akut yang
menyerang salah satu bagian dan atau lebih dari saluran nafas mulai dari hidung
(saluran atas) hingga alveoli (saluran bawah) termasuk jaringan adneksanya,
seperti sinus, rongga telinga tengah dan pleura (Ranuh, 1997; Depkes, 2003).
Penyakit ISPA (Infeksi Saluran Penyakit Akut) diakibatkan oleh virus, secara
garis besar ISPA dibedakan menjadi Common Cold pemicunya adalah virus
(Rhinovirus, Espiratory Syncytial Virus, Adenovirus, dan lain sebagainya) dan
influenza yang dipicu oleh virus influenza dengan berbagai tipe yang ada, ISPA
bisa menimpa semua kelompok umur karena secara umum ada tiga faktor resiko
terjadinya ISPA yaitu faktor lingkungan, faktor individu anak, serta faktor
perilaku. Faktor lingkungan meliputi pencemaran udara (polusi udara) dalam
ruangan yaitu rumah, polusi luar ruangan yaitu lingkungan sekitar, kondisi fisik
rumah, dan kepadatan hunian rumah. Faktor individu anak meliputi umur anak,
berat badan lahir, status gizi, vitamin A, dan status imunisasi. Sedangkan faktor
perilaku berhubungan peningkatan suhu bumi dan kelembaban. Salah satu
penyebab terjadinya ISPA pada balita rata-rata lama pemberian ASI secara
ekslusif terdapat hubungan yang signifikan antara lama pemberian ASI secara
ekslusif dengan frekuensi kejadian ISPA dalam 1 bulan (p<0,05). Arah
hubungan adalah negative yang berarti semakin lama pemberian ASI secara
ekslusif maka frekuensi kejadian ISPA dalam jangka 1 bulan terakhir akan
semakin kecil (Prameswari, 2009). Penyakit ini bisa ditandai dengan panas
disertai salah satunya atau lebih gejala tenggorakan sakit atau nyeri telan, pilek,
batuk-batuk kering atau berdahak, kesulitan untuk bernafas yang dapat
menyebabkan berujung pada kematian di beberapa negara berkembang termasuk
di Indonesia.

1
2

ISPA dapat dibedakan menjadi dua macam, terdapat ISPA non pneumonia
yang dikenal oleh masyarakat dengan istilah batuk pilek sedangkan ISPA
pneumonia terjadi apabila batuk pilek disertai dengan gejala lain, kesukaran
bernapas, peningkatan frekuensi napas (napas cepat). Infeksi Saluran Pernapasan
Akut (ISPA) mencakup tiga unsur utama, yaitu infeksi, saluran pernapasan, dan
keakutan. Infeksi adalah invasi kuman atau mikroorganisme ke dalam tubuh
manusia dimana mereka mereproduksi dirinya sendiri, dengan demikian
menyebabkan gejala penyakit. Saluran pernapasan adalah seperangkat organ
tubuh, yang dimulai dari hidung ke alveoli bersama dengan organ adneksa.
Sementara itu, infeksi akut adalah infeksi yang berlangsung selama 14 hari atau
lebih. Berdasarkan pedoman pemberantasan penyakit ISPA untuk
penanggulangan pneumonia pada anak balita (Depkes, 2004), bahwa kriteria
untuk menanggulangi pola tatalaksana penyakit ISPA adalah anak balita dengan
gejala batuk atau kesulitan bernafas. Penyakit ISPA sangat berpengaruh besar
pada tingkat morbiditas dan mortalitas, karena salah satu penyakit infeksi
menular di dunia.

Menurut data dari WHO, sekitar empat juta orang meninggal karena ISPA
setiap tahun, 98% disebabkan oleh infeksi saluran pernapasan akut. 1,4 juta di
Indonesia dimana berdasarkan hasil Riset Kesehatan Dasar (Riskesdas) tahun
2013 didapatkan data bahwa prevalensi nasional ISPA di Indonesia adalah
25,0%, tidak jauh berbeda dengan tahun 2007 yaitu 25,5% . Anak di bawah lima
tahun adalah kelompok yang memiliki sistem kekebalan tubuh yang masih
rentan terhadap berbagai penyakit (Danusantoso, 2012). Kematian akibat
penyakit ISPA pada balita mencapai 12,4 juta pada balita golongan umur 0-1
tahun dan sebannyak 80,3% kematian ini terjadi di negara berkembang
(Kemenkes, 2010). Infeksi saluran pernapasan akut (ISPA) merupakan penyakit
yang sering terjadi pada anak. Infeksi Saluran Pernapasan Akut (ISPA)
merupakan salah satu masalah kesehatan yang ada di negara berkembang dan
negara maju. Hal ini disebabkan karena masih tingginya angka kesakitan dan
angka kematian karena ISPA khususnya pneumonia, terutama pada bayi dan
balita. Dimana ISPA
3

merupakan salah satu penyebab utama kematian dengan membunuh ± 4 juta


anak balita setiap tahun (Rudianto, 2013).

ISPA merupakan salah satu penyebab utama kunjungan pasien di


puskesmas (40%-60%) dan rumah sakit (15%-30%) (Direktorat Jenderal
Pengendalian Penyakit dan Penyehatan Lingkungan (Ditjen P2PL, 2011). Di
Indonesia kasus ISPA selalu menempati urutan pertama penyebab kematian
bayi, sebanyak 36,4% kematian bayi pada tahun 2008 (32,1%) pada tahun 2009
(18,2%) pada tahun 2010 dan38,8% pada tahun 2011 disebabkan karena ISPA.
Selain itu, ISPA sering berada pada daftar sepuluh penyakit terbanyak
penderitanya di rumah sakit. Survei mortalitas yang dilakukan Subdit ISPA
tahun 2010 menempatkan ISPA sebagai penyebab terbesar kematian bayi di
Indonesia dengan persentase 22,30% dari seluruh kematian balita (Depkes RI,
2012).

Berdasarkan data yang dihimpun dari pemerintah Kabupaten Bekasi


penyakit pernafasan ISPA masih menjadi ancaman utama, sampai bulan Agustus
tahun 2018 tercatat sebanyak 32.911 balita yang menderita penyakit ISPA akibat
musim kemarau, jumlah tersebut meningkat dari tahun sebelumnya yang
mencapai hingga 29.758 orang. Kepala Dinas Kesehatan Kabupaten Bekasi
mengatakan bahwa konndisi cuaca yang mempengaruhi penyebab terjadinya
penyakit ISPA. Penderita ISPA berpotensi pula terjangkit penyakit radang paru-
paru atau pneumonia dimana pada Agustus 2018 ini jumlahnya sudah mencapai
1.466 balita.

Secara umum jumlah pasien ISPA mengalami peningkatan saat musim


kemarau. Pengobatan pasien ISPA umumnya diobati tergantung symptomatis
(penyebab) penyebab penyakit berdasarkan gejalanya. ISPA dapat dicegah
dengan mengetahui penyakit ISPA, mengatur pola makan balita menciptakan
lingkungan yang nyaman, dan menghindar faktor pencetus. Kepala Puskesmas
Mekarmukti, Kecamatan Cikarang Utara, Kabupaten Bekasi, menyatakan 38
orang balita terkena penyakit ISPA non pneumonia dan 122 orang terkena
penyakit ISPA pneumonia selama satu tahun 2017. Penderita penyakit ISPA
mayoritas adalah balita, Pasien ISPA sering pula terserang batuk, jadi
Puskesmas
4

memberikan obat batuk. Jika dalam waktu tiga hari pasien masih menderita
ISPA, biasanya mereka akan kembali lagi ke Puskesmas untuk diberikan surat
rujukan untuk dirawat ke rumah sakit.

Berdasarkan permasalahan yang telah disebutkan diatas, perlu untuk kita


mengetahui lebih lanjut faktor-faktor apa saja yang mempengaruhi terjadinya
ISPA (Infeksi Saluran Pernafasan Akut) pada balita agar tidak terjadi lagi hal
untuk menampilkan pola penyebaran penyakit ISPA menjadi 2 kategori
berdasarkan faktor-faktor yang telah dijelaskan dengan menggunakan prediksi.
Kategori penyakit ISPA yang ada di penelitian ini diantaranya adalah ISPA non
pneumonia dan ISPA pneumonia. Berdasarkan uraian diatas maka penulis
tertarik dan ingin mengkaji ulang untuk mengetahui gambaran karakteristik
penyakit ISPA non pneumonia dan ISPA pneumonia bagi balita, maka penulis
bermaksud mengajukan penelitian dengan judul “Perancangan Data Mining
Untuk Klasifikasi Dalam Prediksi Penyakit ISPA Pada Balita Dengan Algoritma
C4.5”

1.2 Identifikasi Masalah


Berdasarkan latar belakang masalah yang telah diuraikan diatas, maka
penulis dapat mengidentifikasi masalah peneltian yang ada sebagai berikut:
1. Peru dilakukan penelitian untuk meningkatkan akurasi untuk menghasilkan
informasi yang akurat dalam mendiagnosa penyakit ISPA non pneumonia
atau pneumonia pada balita.
2. Peningkatan risiko kesukaran bernapas atau peningkatan frekuensi napas
(napas cepat) pada balita yang terkena penyakit ISPA ringan (non
pneumonia) sehingga dapat menyebabkan terjadinya penyakit ISPA
pneumonia yang timbul disebabkan oleh batuk pilek yang tak kunjung
sembuh disertai gejala lain karena belum adanya suatu prediksi dalam
klasifikasi penyakit ISPA.

1.3 Batasan Masalah


Batasan masalah pada penelitian ini adalah sebagai berikut:
5

1. Peningkatan akurasi pada prediksi penyakit ISPA non pneumonia atau


pneumonia menggunakan algoritma C4.5, dan menggunakan aplikasi
Rapidminer untuk menghitung tingkat akurasi penyakkit ISPA non
pneumonia atau pneumonia di Puskesmas Mekarmukti Cikarang Utara.
2. Penerapan metode klasifikasi yang dilakukan menggunakan algoritma C4.5
untuk memprediksi penyakit ISPA.

1.4 Rumusan Masalah


Sesuai dengan permasalahan yang diangkat pada latar belakang penulisan,
maka masalah yang akan dibahas dapat dirumuskan sebagai berikut:
1. Bagaimana pendekatan dengan algoritma C4.5 mampu untuk
mengklasifikasi penyakit ISPA non pneumonia atau pneumonia?
2. Berapa tingkat keakuratan yang akan dihasilkan dari pemakaian algoritma
C4.5 dalam mengklasifikasi penyakit ISPA non pneumonia atau
pneumonia?

1.5 Tujuan Penelitian


Berdasarkan uraian dari permasalahan diatas, maka tujuan dari penelitan ini
antara lain adalah sebagai berikut:
1. Mengklasifikasi jenis penyakit ISPA non pneumonia ataupun pneumonia
dengan menggunakan algoritma C4.5
2. Mengetahui tingkat keakuratan dari penggunaan algoritma C4.5
mengklasifikasikan jenis penyakit ISPA non pneumonia dan pneumonia.

1.6 Manfaat Penelitian


1.6.1 Bagi Penulis
a. Meningkatkan pengetahuan keilmuan pada bidang Teknik Informatika
khususnya pendekatan data mining serta sebagai salah satu syarat
kelulusan gelar sarjana S1 program studi Teknik Informatika di STT
Pelita Bangsa.
b. Mempelajari lebih dalam mengenai klasifikasi dan prediksi yang
digunakan dalam perhitunngan data mining.
1.6.2 Bagi Masyarakat
6

a. Mengurangi terjadinya balita yang terkena penyakit ISPA.


b. Memberikan informasi kepada orang tua dan masyarakat agar
menghindari faktor apa saja yang menyebabkan balita terkena penyakit
ISPA.
1.6.3 Bagi Program Studi Teknik Informatika STT Pelita Bangsa
a. Memberikan referensi pengetahuan mengenai algoritma yang bisa
diterapkan dalam proses perancangan data mining klasifikasi dalam
prediksi penyakit ISPA di Sekolah Tinggi Teknologi Pelita Bangsa.
b. Menambah sumber kajian diperpustakaan STT Pelita Bangsa serta dapat
menjadi tolak ukur tentang penguasaan, pemahaman materi kuliah yang
diberikan kepada mahasiswa.
1.6.4 Bagi Tenaga Medis Kesehatan
a. Membantu praktisi kesehatan untuk pengambilan keputusan secara dini
dengan akurasi terbaik dalam mendiagnosa penyakit ISPA.
b. Memberikan informasi yang cukup akurat bagi praktisi kesehatan
mengenai klasifikasi serta memprediksi penyakit ISPA.

1.7 Sistematika Penulisan


Penyusunan ini untuk mengetahui secara ringkas permasalahan yang ada
dalam penyusunan penelitian ini, maka menggunakan sistematika penulisan
yang bertujuan untuk mempermudah pembaca dalam memahami penelitian ini,
dengan uraian sebagai berikut:

BAB I PENDAHULUAN
Pada bab ini berisi tentang latar belakang masalah, identifikasi masalah,
batasan masalah, rumusan masalah, tujuan penelitian, manfaat penelitian, dan
sistematika penulisan penelitian.

BAB II TINJAUAN PUSTAKA


Pada bab ini berisi tentang penjelasan tinjauan pustaka mengenai penelitian
ini, yaitu penelitian terdahulu, penyakit ISPA, data mining, algoritma C4.5.
7

BAB III METODE PENELITIAN


Pada bab ini berisi penjelasan tentang deskripsi data penelitian yang
digunakan serta proses umum sistem dan tahap-tahap penyelesaian masalah.

BAB IV HASIL DAN PEMBAHASAN


Pada bab ini berisi tentang hasil dan pembahasan yang diperoleh dari
penelitian yang telah dilakukan.

BAB V PENUTUP
Pada bab ini terdiri dari kesimpulan yang berisi tentang hal-hal terpenting
yang dibahas, bab ini juga berisi saran yang diberikan dan mungkin dapat
menambah pengetahuan untuk pengembangan perangkat lunak yang telah
dibuat.
BAB II

TINJAUAN PUSTAKA

2.1 Penelitian Terdahulu


Perancangan Data Mining untuk Klasifikasi Prediksi Penyakit ISPA dengan
Algoritma C4.5 (Meylitasari, Dwi Br. Tarigan, Palupi, Dian Rini, Puspita,
Verlly, 2017). Pada penelitian ini membuat perancangan data mining untuk
memprediksi penderita penyakit ISPA untuk kategori akut dan tidak akut
menggunakan klasifikasi algoritma C4.5, karena rules yang terbentuk sederhana.
Algoritma C4.5 menggunakan gain ratio sebagai penentu simpul akar, internal
dan daun. Algoritma C4.5 dapat menangani data numerik (continyu) dan diskret.

Penerapan Data Mining untuk Klasifikasi Prediksi Penyakit ISPA (Infeksi


Saluran Pernapasan Akut) Dengan Algoritma C4.5 Decision Tree (ID3)
(Embun, Aline Pramadhani, Setiadi, Tedy, 2014). Perangkat lunak yang
dihasilkan mampu menerapkan proses data mining untuk mengklasifikasikan
penyakit ispa dengan atribut yang paling berpengaruh yang pertama adalah gizi
sebesar 240.9 kemudian atribut yang berpengaruh kedua adalah imunisasi
sebesar 18.7 dan yang terakhir adalah atribut usia sebesar 10.7. Dengan
demikian, atribut yang paling tidak terpengaruh seseorang terkena ispa adalah
jenis kelamin.

Data Mining untuk Memprediksi Jenis Transaksi Nasabah Pada Koperasi


Simpen Pinjam Dengan Algoritma C4.5 (Widayu, Hikma, Darma, Surya
Nasution, Silalahi, Natalia, Mesran, 2017). Dari hasil penelitian ini dapat dilihat
bahwa transaksi nasabah sudah dapat dikenali sehingga pihak koperasi simpan
bisa mengambil keputusan yang berkaitan dengan transaksi yang akan dilakukan
oleh nasabah untuk masa yang akan datang. Dan pihak manajer harus
meningkatkan lagi tawaran-tawaran transaksi yang ada di koperasi untuk
menarik perhatian nasabah baru.

2.2 Tinjauan Teori

8
9

Pada bab ini menjelaskan teori yang digunakan untuk mendukung penelitian
yang dilakukan. Pengertian serta teori yang dijabarkan yaitu mengenai
mengklasifikasi penyakit ISPA non pneumonia atau pneumonia, pengertian data
mining, pengertian klasifikasi, pengertian pohon keputusan (decision tree),
kelebihan decision tree, kekurangan decision tree, pengertian algoritma C4.5,
kelebihan algoritma C4.5, kekurangan algoritma C4.5, pengertian ISPA, non
pneumonia, pengertian ISPA pneumonia, penyebab terjadinya ISPA.

2.2.1 Pengertian Data Mining


Menurut Gorunescu, (2011). Nama data mining mulai dikenal sejak tahun
1990 ketika pekerjaan pemanfaatan data menjadi suatu yang penting dalam
berbagai bidang, mulai dari bidang akademik, bisnis hingga medis (Prasetyo,
2014). Munculnya data mining diawali dengan banyaknya jumlah data yang
tersimpan dalam database yang semakin besar. Berikut dibawah ini adalah
beberapa pengertian tentang data mining yang didapatkan oleh penulis yaitu
diantaranya. Menurut Pregibon data mining adalah campuran dari statistik,
kecerdasan buatan, dan riset basis data yang masih berkembang (Prasetyo,
2014). Selain pengertian di atas terdapat beberapa pengertian lain tentang data
mining yang di kemukakan oleh para ahli yaitu menurut Mujiasih, (2011). Data
mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis
untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar.
Keluaran data mining ini bisa dipakai untuk membantu pengambilan keputusan
di masa depan. Pengembangan KDD ini menyebabkan penggunaan pattern
recognition semakin berkurang karena telah menjadi bagian data mining
(Fadlina, 2014).

Tujuan dari teknik data mining adalah berusaha mencari manfaat dari
sekumpulan data tersebut. Dilihat dari disiplin ilmu yang digunakan, data mining
merupakan sebuah ilmu multi disiplin yang menyangkut berbagai disiplin ilmu
seperti database, kecerdasan buatan (artificial intelligence), information science
(ilmu informasi), high performance computing, visualisasi, machine learning,
statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika,
information retrieval dan information extraction serta pengenalan pada sebuah
1

pola. Saat ini data mining juga berkembang menjadi salah satu dari berbagai
konsep disiplin ilmu lain, seperti web mining dan text mining (Dini, 2014).

Data mining adalah suatu istilah yang digunakan untuk menemukan


pengetahuan yang tersembunyi di dalam database. Data mining merupakan
proses semi otomatik yang menggunakan teknik statistik, matematika,
kecerdasan buatan, dan machine learning untuk mengekstraksi dan
mengidentifikasi informasi pengetahuan potensial dan berguna yang bermanfaat
yang tersimpan di dalam database besar (Turban, E., Aronson, J. E. & Liang, T.,
2005).

Enam fase CRISP-DM ( Cross Industry Standard Process for Data


Mining) (Larose D, T., 2005).

1. Fase Pemahaman Bisnis ( Business Understanding Phase )


2. Fase Pemahaman Data ( Data Understanding Phase )
3. Fase Pengolahan Data ( Data Preparation Phase )
4. Fase Pemodelan ( Modeling Phase )
5. Fase Evaluasi ( Evaluation Phase )
6. Fase Penyebaran (Deployment Phase)

2.2.2 Pengertian Klasifikasi


Klasifikasi adalah proses dari mencari suatu himpunan model (fungsi)
yang dapat mendeskripsikan dan membedakan kelas-kelas data atau konsep-
konsep, dengan tujuan dapat menggunakan model tersebut untuk memprediksi
kelas dari suatu objek yang mana kelasnya belum diketahui (jantan et al, 2010).

Klasifikasi merupakan suatu pekerjaan menilai objek data untuk


memasukkannya ke dalam kelas dari sejumlah kelas yang tersedia. Dalam
klasifikasi ada dua pekerjaan utama yang dilakukan, yaitu:
1. Pembangunan model sebagai prototype untuk disimpan sebagai memori.
2. Pengunaan model tersebut untuk melakukan pengenalan/klasifikasi/prediksi/
pada suatu objek data lain agar diketahui dikelas mana objek data tersebut
dalam model yang sudah disimpannya (Eko Prasetyo, 2014).
1

2.2.3 Pengertian Pohon Keputusan (Decision Tree)


Decision tree merupakan metode yang ada pada teknik klasifikasi dalam
data mining. Metode pohon keputusan mengubah fakta yang sangat besar
menjadi pohon pohon keputusan yang mempresentasikan aturan. Pohon
keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan
tersembunyi antara jumlah calon variable input dengan sebuah variabel target
(Bundanis Dwi Meilani Achmad, 2012).

Metode ini digunakan untuk memprediksi nilai diskrit dari fungsi target,
yang mana fungsi pembelajaran dipresentasikan oleh sebuah decision tree
(G.Liang, 2005). Decision tree merupakan himpunan IF…THEN. Setiap path
dalam tree dihubungkan sebuah aturan, dimana presi terdiri dari sekumpulan
node-node yang ditemui, dan kesimpulan dari aturan terdiri atas kelas yang
terhubung dengan leaf dari path.

Terdapat 3 jenis node yang terdapat pada decision tree (Joko Lianto, Umi
Hanik, and Ahmad Saikhu, 2011), yaitu:
a. Root node, merupakan node paling atas, pada node ini tidak ada input
dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.
b. Internal Node, merupakan node percabangan. Pada node ini terdapat
percabangan. Pada node ini terdapat satu input dan memiliki output
mininmal dua.
c. Leaf node atau terminal node, merupakan node akhir. Pada node ini
terdapat satu input dan tidak mempunyai output (Kusrini, Emma Taufiq
Luthfi, 2009).

2.2.4 Kelebihan Decision Tree


Decision Tree selain mudah untuk diinterpretasikan oleh manusia untuk
kebutuhan klasifikasi mempunyai beberapa kelebihan lain. Menurut Vulandari
(2017), Decision Tree memiliki 4 kelebihan antara lain, yaitu :
1

1. Membuat serangkaian cara dalam membuat keputusan yang sebelumnya


mempunyai ruang lingkup luas dan kompleks menjadi lebih spesifik,
ringkas dan sederhana.
2. Penggunaan metode Decision Tree hanya menguji data sample
berdasarkan kriteria atau kelas tertentu dan mengeliminasi perhitungan-
perhitungan yang tidak digunakan, untuk memudahkan proses
pengambilan keputusan.
3. Dapat digunakan secara fleksibel karena dapat memilih internal node
sesuai dengan kriteria yang dimiliki data sample, untuk meningkatkan
kualitas dari keputusan yang akan dihasilkan dari pohon keputusan.
4. Decision Tree dapat menggunakan kriteria yang jumlahnya sedikit pada
internal node tanpa perlu melakukan estimasi dari segi distribusi dimensi
tinggi dan parameter tertentu dengan jumlah kelas atau kriteria yang
banyak, hal ini tidak mempengaruhi tingkat kualitas dari hasil keputusan.

2.2.5 Kekurangan Decision Tree


Berikut ini kekurangan dari Decision Tree menurut Vulandari (2017),
antara lain yaitu:
1. Jika kriteria mencapai jumlah yang sangat besar menyebabkan overlap
yang dapat memperlambat dalam proses pengambilan keputusan serta
membutuhkan jumlah memori yang besar.
2. Setiap tingkat pada kriteria dalam Decision Tree terjadi akumulasi jumlah
eror sehingga dapat menyebabkan jumlah eror yang besar.
3. Kesulitan membuat desain untuk Decision Tree yang menghasilkan
keputusan secara optimal.

2.2.6 Pengertian Algoritma C4.5


Beberapa pengembangan yang dilakukan pada C4.5 adalah sebagai antara
lain bisa mengatasi missing value, bisa mengatasi contius data, dan pruning
(Fadillah, 2013). Jantan et al, (2010) menyebutkan algoritma C4.5 merupakan
salah satu teknik decision tree yang sering digunakan, yang menghasilkan
1

beberapa aturan-aturan dan sebuah pohon keputusan dengan tujuan untuk


meningkatkan keakuratan dari prediksi yang sedang dilakukan, di samping itu
algoritma C4.5 merupakan algoritma yang mudah dimengerti.

Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah


sebagai berikut (Kusrini et al, 2009):
a. Pilih atribut sebagai akar
b. Buat cabang untuk tiap-tiap nilai
c. Bagi kasus dalam cabang
d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang
memiliki kelas yang sama.

Algoritma C4.5 adalah salah satu metode untuk membuat decision tree
berdasarkan training data yang telah disediakan. Algoritma C4.5 merupakan
pengembangan dari ID3. Beberapa pengembangan yang dilakukan pada C4.5
adalah sebagai antara lain bisa mengatasi missing value, bisa mengatasi continiu
data, dan pruning. Pohon keputusan mirip sebuah struktur pohon dimana
terdapat node internal (bukan daun) yang mendeskripsikan atribut-atribut, setiap
cabang menggambarkan hasil dari atribut yang diuji, dan setiap daun
menggambarkan kelas. Pohon keputusan bekerja mulai dari akar paling atas, jika
diberikan sejumlah data uji, misalnya X dimana kelas dari data X belum
diketahui, maka pohon keputusan akan menelusuri mulai dari akar sampai node
dan setiap nilai dari atribut sesuai data X diuji apakah sesuai dengan aturan
pohon keputusan, kemudian pohon keputusan akan memprediksi kelas dari tupel
X. Pada tahap algoritma C4.5 memiliki 2 prinsip kerja yaitu:

1. Pembuatan pohon keputusan. Tujuan dari algoritma penginduksi pohon


keputusan adalah mengkontruksi struktur data pohon yang dapat digunakan
untuk memprediksi kelas dari sebuah kasus atau record baru yang belum
memiliki kelas. C4.5 melakukan konstruksi pohon keputusan dengan metode
divide and conquer. Pada awalnya hanya dibuat node akar dengan
menerapkan algoritma divide and conquer. Algoritma ini memilih pemecahan
kasus-kasus yang terbaik dengan menghitung dan membandingkan gain
ratio, kemudian
1

node-node yang terbentuk di level berikutnya, algoritma divide and conquer


akan diterapkan lagi sampai terbentuk daun-daun.
2. Pembuatan aturan-aturan (rule set). Aturan-aturan yang terbentuk dari pohon
keputusan akan membentuk suatu kondisi dalam bentuk if-then. Aturan-
aturan ini didapat dengan cara menelusuri pohon keputusan dari akar sampai
daun. Setiap node dan syarat percabangan akan membentuk suatu kondisi
atau suatu if, sedangkan untuk nilai-nilai yang terdapat pada daun akan
membentuk.

Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah


sebagai berikut :
a. Pilih atribut sebagai akar.
b. Buat cabang untuk tiap-tiap nilai.
c. Bagi kasus dalam cabang.
d. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang
memiliki kelas yang sama.

Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada. Untuk suatu atribut yang populer, dapat dihitung
dengan cara pengelompokan berdasarkan masing-masing atribut dalam suatu data.
Notasi information gain adalah Gain (S,A) yang berarti dalam data atribut A relatif
terhadap output S. Digunakan rumus seperti tertera dalam persamaan 1 berikut:
Rumus : Gen(S,A) = Entropy(S) – ∑𝑛 |𝑠𝑖| * Entropy(Si)....(2.1)
𝑖=1 |𝑠|

Keterangan:
S : himpunan kasus
A : atribut
n : jumlah partisi atribut A
|Si| : jumlah kasus pada partisi ke-i
|S| : jumlah kasus dalam S
Sementara itu, penghitungan nilai entropy dapat dilihat pada persamaan 2
berikut :
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖.......(2.2)
𝑖

Keterangan:
1

S : himpunan kasus
A : fitur
n : jumlah partisi S
pi : proporsi dari S_i terhadap S

Sementara itu, perhitungan nilai split falidation yaitu untuk menghitung


nilai split pada setiap nilai atribut atau term baru sebelum menentukan gain
ratio, dapat dilihat pada persamaan 3 berikut:
Rumus: Split information(S,A) = − ∑𝑛 ∗ ∗ 𝑆𝑖 ....... (2.3)
log 𝑆𝑖
𝑖=1 2 𝑆

Sementara itu, Gain Ratio, yaitu nilai yang dipilih untuk menjadi root
node atau akar pohon, dapat dilihat pada persamaan 4 berikut:
𝐺𝑎𝑖𝑛 (S,A)
Rumus: Gain Ratio(S,A) = (2.4)
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (S,A)........
Keterangan :
S = Himpunan dataset kasus atau ruang sample
N = Banyaknya patisi S
A = Atribut
Pi = Probabilitas dari atribut kelas dibagi jumlah total kasus (i)
Si = Jumlah kasus pada atribut A yang memiliki partisi (i)

Pada saat pembangunan pohon keputusan, banyaknya cabang mungkin


mencerminkan adanya noise atau outlier pada training data. Pemangkasan
pohon dapat dilakukan untuk mengenali dan menghapus cabang-cabang tersebut.
Pohon yang dipangkas akan menjadi lebih kecil dan lebih mudah dipahami.
Pohon semacam itu biasanya juga menjadi lebih cepat dan lebih baik dalam
melakukan klasifikasi (K. and E. T. Luthfi, 2009).

2.2.7 Kelebihan C4.5


Algoritma C4.5 memiliki tiga keuntungan, (Singh & Gupta, 2014). Berikut
keuntungan algoritma C4.5 diantaranya, yaitu :
1. Dapat menangani atribut bertipe diskrit dan kontinyu.
1

2. Jika terdapat nilai atribut yang hilang maka dapat di ubah menjadi tanda
“?”, nilai tersebut tidak akan digunakan dalam perhitungan gain dan
entropy.
3. Dapat dilakukan pemangkasan terhadap cabang pohon yang tidak
membantu dan menggantinya dengan leaf node.

2.2.8 Kekurangan C4.5


Selain keuntungan algoritma C4.5 memiliki beberapa kerugian. Berikut
kerugian dari algoritma C4.5 menurut Sigh dan Gupta (2014) antara lain, yaitu :
1. Algoritma C4.5 dapat membangun cabang kosong yang nilainya tidak
berkontribusi untuk menghasilkan aturan.
2. Terjadi overfitting akibat dari noise data.
3. Kebisingasn (noise data) yang rentan terjadi pada C4.5.

2.2.9 Pengertian ISPA


ISPA adalah radang akut saluran pernafasan atas maupun bawah yang
disebabkan infeksi jasad remik atau bakteri, virus maupun rikitsia tanpa atau
disertai dengan radang parenkim paru.

Istilah ISPA merupakan singkatan dari Infeksi Saluran Pernapasan Akut


dengan pengertian sebagai berikut: Infeksi adalah masuknya Mikroorganisme ke
dalam tubuh manusia dan berkembang biak sehingga menimbulkan penyakit.
Saluran pernapasan adalah organ mulai dari hidung hingga alveoli beserta organ
adneksanya seperti sinus, rongga telinga tengah dan pleura. Infeksi akut adalah
infeksi yang berlangsung sampai dengan 14 hari. Batas 14 hari diambil untuk
menunjukkan proses akut meskipun untuk beberapa penyakit yang dapat
digolongkan dalam ISPA, kurang dari 14 hari. Biasanya diperlukan waktu
penyembuhan 5 – 14 hari (Nurrijal, 2009).
Maka ISPA adalah proses infeksi akut berlangsung selama 14 hari, yang
disebabkan oleh mikroorganisme dan menyerang salah satu bagian, dan atau
lebih dari saluran napas, mulai dari hidung (saluran atas) hingga alveoli (saluran
bawah), termasuk jaringan adneksanya, seperti sinus, rongga telinga tengah dan
pleura (Nurrijal, 2009). Program Pemberantasan Penyakit (P2) ISPA membagi
penyakit ISPA dalam 2 golongan yaitu pneumonia dan yang bukan pneumonia.
1

Pneumonia dibagi atas derajat beratnya penyakit yaitu pneumonia berat dan
pneumonia tidak berat. Penyakit batuk pilek seperti rinitis, pharingitis, tonsilitis
dan penyakit jalan napas bagian atas lainnya digolongkan sebagai bukan
pneumonia. Pharingitis oleh kuman Streptococcus jarang ditemukan pada
balita(Depkes,2008).

2.2.10 Pengertian ISPA Non Pneumonia (ISPA Ringan)


ISPA ringan atau sering disebut non pneumonia (ISPA ringan) meliputi
batuk pilek biasa (common cold), radang tenggorokan (pharyngitis), tonsilitis
dan infeksi telinga (otitis media) (Anonim, 2008).

Balita dengan gejala batuk dan tidak menunjukan gejala peningkatan


frekuensi nafas serta tarikan dinding pada bagian bawah ke arah dalam (Widoyo,
2008).

Anak dapat dinyatakan mengidap ISPA ringan apabila ditemukan satu


atau lebih dari beberapa gejala batuk, serak, bersuara parau saat berbicara atau
menangis, pilek, panas atau demam suhu badan lebih dari 37 derajat. Jika ada
nafas cepat, dan tidak ditemukan tarikan dinding dada bagian bawah (Nelson,
2007).

Kelompok usia < 2 bulan apabila tidak ditemukan nafas cepat dan tarikan
dinding dada bagian bawah ke dalam. Kelompok usia dua bulan sampai kurang
dari 5 tahun apabila dalam pemeriksaan frekuensi nafas sesuai dengan golongan
usia yakni, kurang dari 50x per menit untuk golongan usia dua bulan hingga 12
bulan, kurang dari 40x per menit untuk golongan usia 12 bulan hingga 5 tahun
(Depkes RI, 2007).

2.2.11 Pengertian ISPA Pneumonia(ISPA Sedang/Berat)


ISPA sedang/berat (pneumonia) adalah masuknya kuman atau
mikroorganisme ke dalam tubuh manusia dan berkembang biak sehingga
menimbulkan gejala penyakit. Mencakup saluran pernafasan bagian atas, saluran
pernafasan bagian bawah yang menimbulkan infeksi yang berlangsung sampai
dengan 14 hari (Depkes, 2004).
1

ISPA sedang/ berat adalah suatu tanda dan gejala akut akibat infeksi yang
terjadi pada setiap bagian saluran pernafasan baik atas maupun bawah yang
disebabkan oleh jasad remik atau bakteri, virus maupun riketsin tanpa atau
disertai dengan radang dari parenkim. Pneumonia berat disertai dengan tanda
tarikan dinding dada bagian bawah kedalam (chest in drawing), pneumonia berat
disertai dengan tanda nafas cepat sesuai golongan umur.

Anak dapat dinyatakan mengidap ISPA sedang apabila ditemukan gejala


ISPA ringan yang disertai salah satu atau lebih gejala ISPA sedang/berat
(pneumonia) suhu badan melebihi 39 derajat celsius, tenggorokan merah, timbul
bercak-bercak merah dikulit serupa dengan campak, telinga sakit atau keluarnya
nanah dari lubang telinga, pernafasan berbunyi seperti orang mendengkur serta
anak tampak seperti gelisah, bibir atau kulit yang membiru, anak tidak sadarkan
diri (terjadi penurunan kesadaran), sela iga tertarik kedalam saat bernafas, nadi
cepat melebihi 160x atau nadi tidak teraba. Pernapasan cepat, yakni frekuensi
nafas melebihi 60 kali per menit untuk usia dibawah 2 bulan, frekuensi nafas
lebih dari 50 kali per menit untuk usia 2 bulan hingga <12 bulan atau frekuensi
nafas melebihi 40 kali per menit pada usia 12 bulan - 5 tahun (Nelson, 2007).

Kelompok usia < 2 bulan apabila dalam pemeriksaan didapatkan adanya


penarikan kuat dari dinding dada bagian bawah ke dalam yang sering disebut
dengan chest indrawing atau adanya nafas cepat melebihi 60 kali per menit.
Kelompok usia 2 bulan sampai kurang dari 5 tahun apabila adanya nafas cepat,
frekuensi nafasnya sesuai dengan golongan usia yakni 50x atau lebih per menit
pada usia 2 bulan sampai dengan 1 tahun dan 40x atau lebih per menit pada usia
1 – 5 tahun. Dalam pemeriksaan tidak didapatkannya tarikan dinding dada
bagian bawah ke dalam. Atau bisa terjadi apabila ditemukan sesak nafas dalam
pemeriksaan fisik dan saat inspirasi didapatkan adanya penarikan kuat dari
dinding dada bagian bawah ke dalam (Depkes RI, 2007).

2.2.12 Penyebab Terjadinya ISPA


1

Penyakit ISPA dapat disebabkan oleh berbagai penyebab seperti bakteri,


virus, mycoplasma, jamur dan lain-lain. ISPA bagian atas umumnya disebabkan
oleh virus, sedangkan ISPA bagian bawah dapat disebabkan oleh bakteri, virus
dan mycoplasma. ISPA bagian bawah yang disebabkan oleh bakteri umumnya
mempunyai manifestasi klinis yang berat sehingga menimbulkan beberapa
masalah dalam penanganannya(Mennegethi,2009). Bakteri penyebab ISPA
antara lain adalah dari genus streptcocus, Stapilococcus, Pneumococcus,
Hemofillus, Bordetella dan Corinebacterium.

Virus penyebab ISPA diantara lain adalah terdiri dari beberapa golongan
Miksovirus, Adenovirus, Koronavirus, Pikornavirus, Mikoplasma, Herpesvirus
dan lain-lain (Mennegethi,2009). Banyaknya mikroorganisme yang
menyebabkan terjadinya ISPA menyulitkan dalam klasifikasi dari segi kausa,
satu organisme dapat menyebabkan beberapa gejala klinis penyakit serta adanya
satu macam penyakit yang bisa disebabkan oleh berbagai macam
mikroorganisme tersebut (Heriyana,2009).
Faktor-faktor yang berperan pada kejadian ISPA adalah sebagai berikut :
1. Faktor host (diri)
a. Usia
Kebanyakan infeksi saluran pernafasan yang sering mengenai anak usia
dibawah 3 tahun, terutama bayi kurang dari 1 tahun. Beberapa penelitian
menunjukkan bahwa anak pada usia muda akan lebih sering menderita
ISPA dari pada usia yang lebih lanjut (Hidayat,2009).
b. Jenis kelamin
Meskipun secara keseluruhan di negara yang sedang berkembang seperti
Indonesia masalah ini tidak terlalu diperhatikan, namun banyak
penelitian yang menunjukkan adanya perbedaan prevelensi penyakit
ISPA terhadap jenis kelamin tertentu. Anak perempuan lebih tinggi dari
laki-laki di negara Denmark(Hidayat,2009).
c. Status gizi
Interaksi antara infeksi dan Kekurangan Kalori Protein (KKP) telah lama
dikenal, kedua keadaan ini sinergistik, saling mempengaruhi, yang satu
merupakan predisposisi yang lainnya. Pada KKP, ketahanan tubuh
2

menurun dan virulensi pathogen lebih kuat sehingga menyebabkan


keseimbangan yang terganggu dan akan terjadi infeksi, sedangkan salah
satu determinan utama dalam mempertahankan keseimbangan tersebut
adalah status gizi anak(Hidayat,2009).
d. Status imunisasi
Ketidak patuhan imunisasi berhubungan dengan peningkatan penderita
ISPA walaupun tidak bermakna. Hal ini sesuai dengan penelitian lain
yang mendapatkan bahwa imunisasi yang lengkap dapat memberikan
peranan yang cukup berarti dalam mencegah kejadian ISPA
(Hidayat,2009).
e. Pemberian suplemen vitamin A
Pemberian vitamin A pada balita sangat berperan untuk masa
pertumbuhannya, daya tahan tubuh dan kesehatan terutama pada
penglihatan, reproduksi, sekresi mukus dan untuk mempertahankan sel
epitel yang mengalami diferensiasi.
f. Pemberian ASI
ASI adalah makanan yang paling baik untuk bayi terutama pada bulan-
bulan pertama kehidupannya. ASI bukan hanya merupakan sumber
nutrisi bagi bayi tetapi juga sebagai sumber zat anti mikroorganisme
yang kuat, karena adanya beberapa faktor yang bekerja secara sinergis
membentuk sistem biologis. ASI dapat memberikan imunisasi pasif
melalui penyampaian antibodi dan sel-sel imunokompeten ke permukaan
saluran pernafasan atas (Hidayat,2009).

2. Faktor lingkungan
a. Rumah
Merupakan stuktur fisik, dimana orang menggunakannya untuk tempat
berlindung yang dilengkapi dengan fasilitas dan pelayanan yang
diperlukan, perlengkapan yang berguna untuk kesehatan jasmani, rohani
dan keadaan sosialnya yang baik untuk keluarga dan individu (WHO,
1989). Anak-anak yang tinggal di apartemen memiliki faktor resiko lebih
2

tinggi menderita ISPA dari pada anak-anak yang tinggal di rumah culster
di Denmark (Hidayat,2009).
b. Kepadatan hunian
Seperti luas ruang per orang, jumlah anggota keluarga, dan masyarakat
diduga merupakan faktor risiko untuk ISPA. Penelitian oleh Koch et al
(2003) membuktikan bahwa kepadatan hunian (crowded) sangat
mempengaruhi secara bermakna prevalensi ISPA berat.
c. Status sosioekonomi
Telah diketahui bahwa kepadatan penduduk dan tingkat sosioekonomi
yang rendah mempunyai hubungan yang erat dengan kesehatan
masyarakat. Tetapi status keseluruhan tidak ada hubungan antara status
ekonomi dengan insiden ISPA, akan tetapi didapatkan korelasi yang
bermakna antara kejadian ISPA berat dengan rendahnya status
sosioekonomi (Hidayat,2009).
d. Kebiasaan merokok
Pada keluarga yang merokok, secara statistik anaknya mempunyai
kemungkinan terkena ISPA 2 kali lipat dibandingkan dengan anak dari
keluarga yang tidak merokok. Selain itu dari penelitian lain didapat
bahwa episode ISPA meningkat 2 kali lipat akibat orang tua merokok
(Hidayat,2009).

2.3 Kerangka Pemikiran


Dalam menyelesaikan penelitian ini dibutuhkan sebuah kerangka pemikiran
sebagai salah satu pedoman yang dilakukan secara konsisten. Permasalahan
penelitian ini belum diketahuinya metode yang tepat dalam akurasi prediksi
penyakit ISPA non pneumonia atau pneumonia. Untuk metode ini menggunakan
algoritma C4.5 untuk memecahkan masalah pengujian terhadap metode tersebut.
Pengujian metode ini dilakukan dengan cara cross validation, confution matrix
dan ROC. Untuk pengembangannya menggunakan aplikasi rapidminer. Berikut
ini ialah kerangka pemikiran yang dilakukan:
2

Dataset Penyakit ISPA

Preprocessing
Data Training

Prediksi

Classification
Decision Tree C4.5

Data Testing

Evaluasi dan Validasi


Confusion Matrix dan ROC Curve

Accuracy, Recall, Precision, dan ROC

Gambar 2.1 Kerangka Pemikiran


BAB III

METODE PENELITIAN

3.1 Objek Penelitian


Objek penelitian merupakan permasalahan yang diteliti. Dalam penelitian
ini yang menjadi objek penelitian ini adalah penyakit ISPA non pneumonia atau
pneumonia yang banyak terjadi pada balita dan bagaimana cara penanganannya.
Data yang diambil berupa dataset penyakit ISPA dengan 10 atribut.

3.1.1 Profile Puskesmas Mekarmukti

Puskesmas adalah Pusat Pelayanan Kesehatan yang merupakan pelayanan


primer. Berdasarkan peraturan menteri kesehatan Republik Indonesia No. 75
Tahun 2014 Ayat 2, bahwa Puskesmas adalah fasilitas pelayanan kesehatan yang
menyelenggarakan upaya pelayanan kesehatan masyarakat dan upaya kesehatan
perseorangan tingkat pertama dengan lebih mengutamakan upaya promotif dan
preventif untuk mencapai derajat kesehatan masyarakat yang setinggi-tingginya
di wilayah kerjanya.

Permenkes ini dipertegas lagi dengan diterbitkannya peraturan Bupati


Kabupaten Bekasi Nomor 18 Tahun 2015 tentang Pembentukan Unit Pelaksana
Teknis Dinas Pusat Kesehatan Masyarakat (PUSKESMAS) pada dinas
kesehatan Bekasi, telah dibentuk Unit Pelaksana Teknis Dinas (UPTD) pusat
kesehatan masyarakat di Kabupaten Bekasi yang terkonsentrasi di Kecamatan
dan Desa/Kelurahan, termasuk salah satunya adalah UPTD Puskesmas
MEKARMUKTI.

Tugas pokok Puskesmas adalah melaksanakan pelayanan, pembinaan dan


pengembangan upaya kesehatan kepada masyarakat di wilayah kerjanya. Dalam
menyelenggarakan tugas pokok sebagaimana dimaksud diatas Puskesmas
mempunyai fungsi sebagai berikut :

23
2

a. Penyiapan bahan perumusan kebijakan teknis di bidang pelayanan,


pembinaan dan pengembangan upaya kesehatan masyarakat di wilayah
kerjanya.
b. Penyelenggaraan sebagian kegiatan teknis operasional dan/atau teknis
penunjang dinas di bidang pelayanan, pembinaan dan pengembangan
upaya kesehatan kepada masyarakat sesuai dengan tugasnya.
c. Pembinaan dan pelaksanaan tugas sesuai dengan lingkup tugasnya.
d. Pelaksanaan tugas lain yang diberikan oleh kepala dinas sesuai dengan
tugas dan fungsinya.

3.1.2 Visi Misi Perusahaan

Visi

Puskesmas berstandar nasional dengan berbasis kenyamanan.


Misi
1. Memberikan pelayanan kesehatan masyarakat yang berkualitas standar
nasional dan santun.
2. Mengembangkan kompetensi SDM yang meliputi skill/ketrampilan,
knowledge/ilmu pengetahuan dan attitude/perilaku agar mampu
memberikan pelayanan santun dan sesuai standar nasional sehingga
masyarakat menjadi pelanggan yang percaya dan loyal ke puskesmas.
3. Melengkapi peralatan medis sesuai standar nasional.
4. Mengembangkan gedung puskesmas yang atraktif melalui perencanaan
pengembangan dengan design interior dan eksterior yang menarik.
5. Menjalin kemitraan dengan pihak ketiga dalam rangka mengembangkan
pelayanan masyarakat berbasis jejaring kemitraan dalam pemberdayaan
masyarakat.

3.2 Peralatan Yang Digunakan


Penelitian yang dilakukan memerlukan peralatan untuk mendukung
pelaksanaan penelitian. Peralatan-peralatan berikut berupa kebutuhan software
2

(perangkat lunak) dan hardware (perangkat keras). Berikut kebutuhan yang


diperlukan antara lain:
1. Kebutuhan software
Berikut adalah kebutuhan software yang diperlukan dalam penelitian ini
antara lain:
a. Sistem Operasi Windows 10 versi 64 bit
Penelitian dilakukan dengan menggunakan sistem operasi Windows 10
versi 64 bit untuk sebagai platform untuk menjalankan program data mining
tools.
b. Rapidminer versi 7.6.1

Rapidminer versi 7.6.1 digunakan sebagai data mining tools untuk


menjalankan tahap-tahap data mining, implemetasi algoritma, serta
menghitung hasil akurasi.

2. Kebutuhan hardware
Berikut adalah hardware yang digunakan dalam penelitian ini antara lain:

a. Laptop Intel Celeron


b. RAM 2 GB
c. Hardisk 500 GB
d. Printer

3.3 Tahapan Penelitian


Tahapan yang akan digunakan dalam penelitian ini dapat dilihat pada gambar
3.1 untuk melakukan prediksi terhadap penyakit ISPA non pneumonia atau
pneumonia pada Puskesmas Mekarmukti di Kabupaten Bekasi, dan berikut ini
beberapa langkah dalam tahapan penelitian yang akan dilakukan.
2

Pengujian
Model
Pengelolaan Pemodelan
Data Awal
Pengumpulan Evaluasi dan
Data Validasi Hasil

Gambar 3.2 Tahapan Penelitian

1. Pengumpulan Data
Tahapan pengumpulan data yang tepat yaitu dengan mempertimbangkan
penggunaannya berdasarkan jenis data dan sumbernya. Data yang objektif dan
relevan dengan pokok permasalahan penelitian yang merupakan indikator
keberhasilan suatu penelitian.
2. Pengelolaan Data Awal
Tahapan ini menjelaskan tahap awal dalam data mining. Data terkumpul
dan dinyatakan lengkap, data tersebut kemudian diseleksi atas dasar reliabilitas
dan validitas. Pengolahan data juga harus memperhtikan bentuk rumusan
masalah dan tujuan penelitian.
3. Pemodelan
Tahapan ini menjelaskan tentang pemilihan dan pemodelan metode yang
digunakan dengan metode algoritma C4.5 pada penelitian. Penjelasan ini juga
mengenai pengaturan untuk mendukung proses dan pemilihan nilai dari atribut-
atribut serta tahapan proses pemodelan dengan algoritma C4.5 yang digunakan.
4. Pengujian Model
Tahapan ini menjelaskan upaya pengujian model, sehingga karakteristik
atau sifat-sifat data tersebut dapat dengan mudah dipahami dan bermanfaat,
untuk menjawab masalah-masalah yang berkaitan dengan penelitian yang tepat
dari model atau metode algoritma C4.5 yang digunakan.
5. Evaluasi dan Validasi Hasil
Tahapan terakhir ini mejelaskan mengenai evaluasi dan validasi hasil
penerapan metode algoritma C4.5 pada penelitian yang dilakukan. Penjelasan
mengenai hal ini akan di bahas lebih jelas pada bab IV.
2

3.4 Tahapan Analisa Data


Dataset penyakit ISPA yang berasal dari Puskesmas Mekarmukti
mempunyai jumlah data sebanyak 160 data terdiri dari 9 atribut dan 1 atribut
sebagai class. Atribut class memiliki dua nilai yaitu non pneumonia dan
pneumonia. Jumlah nilai non pneumonia ada 38 data sedangkan nilai pneumonia
ada 122 data.
Penyakit ISPA pada balita iini dilakukan dengan metode algoritma C4.5,
analisa data ini digunakan untuk mengetahui nilai accuracy, recall, precision,
dan AUC. Dari kumpulan beberapa gejala sehingga menghasilkan jenis penyakit
ISPA pada balita. Pada tabel 3.1 berikut ini berisi jenis penyakit ISPA , data
yang terdapat pada tabel berikut adalah data yang dihasilkan dari Puskesmas
Mekarmukti.

Tabel 3.1 Tabel Daftar Penyakit ISPA

Kode Nama Penyakit ISPA


Penyakit
1 Non Pneumonia
2 Pneumonia

3.4.1 Gejala Penyakit ISPA


Pada bagian ini merupakan daftar tabel gejala-gejala penyakit ISPA yang
menjelaskan semua gejala yang terjadi saat mengalami penyakit ISPA
berdasarkan data penyakit. Tabel gejala ini nantinya akan diklasifikasikan
kedalam jenis penyakit ISPA non pneumonia atau pneumonia berdasarkan gejala
yang terjadi. Berikut ini adalah daftar gejala penyakit ISPA.

Tabel 3.2 Tabel Gejala Penyakit ISPA

Kode Gejala Nama Gejala


1 Batuk
2 Flue
3 Demam
4 Nafas Berat
5 Tenggorokan Merah
2

6 Status Gizi
7 Lingkungan Rokok
3.5 Metode Yang Diusulkan
Pada penelitian ini akan dilakukan analisa menggunakan algoritma C4.5
dalam tahapan ini akan dilakukan beberapa tahap pengujian data yaitu sebagai
berikut ini:

Pengolahan Hasil Algoritma Mendapatkan


Data Dengan C4.5 hasil prediksi
Menggunakan penyakit ISPA
Algoritma C.45 non pneumonia
atau pneumonia

Gambar 3.3 Langkah Pengujian Metode

Karakteristik dari algoritma C4.5 yaitu salah satu algoritma dalam metode
pohon keputusan yang merubah suatu data menjadi pohon keputusan
menggunakan rumus perhitungan Entropy Split.

3.6 Pengumpulan Data


1. Sumber Data
Data yang digunakan pada penelitian ini adalah data balita yang diperoleh
dari sebuah Puskesmas di Kabupaten Bekasi. Data yang digunakan merupakan
data balita dari tahun 2017-2018. Data berupa rekam medis balita yang terkena
penyakit ISPA yang kemudian disalin ke dalam file excel. Dari proses
pengumpulan data, diperoleh jumlah data sebanyak 160 data.

Data yang diperoleh terdiri dari: nama balita, umur balita, berat, batuk,
flue, demam, nafas berat, tenggorokan merah, status gizi, lingkungan rokok, dan
class ISPA (non pneumonia/pneumonia). Berikut tabel 3.1 menunjukan sebagian
dari dataset penyakit ISPA.

Tabel 3.3 Dataset Penyakit ISPA


2

Nafas
Nama Umur Berat Batuk Flue Demam Tenggorokan Status Lingkungan
Class
Berat Merah Gizi Rokok
non
Alwi 3 2 1 2 1 1 2 2 2 pneumonia
non
Thariq 3 3 1 1 1 2 1 2 1 pneumonia

Saefudin 3 2 2 2 2 2 2 2 2 Pneumonia
non
Almalik 3 3 2 1 1 1 2 1 2 pneumonia
non
Alea 3 2 1 2 1 1 2 2 2 pneumonia

Azka 2 2 1 1 3 2 2 1 1 Pneumonia

Rafelin 3 2 1 2 2 2 1 1 2 Pneumonia

Afdal 2 2 2 1 2 2 1 1 2 Pneumonia

Refqi 2 1 2 1 2 2 1 2 2 Pneumonia

Melani 2 2 1 2 2 2 2 1 1 Pneumonia
non
Adelia 1 1 1 2 1 1 1 2 1 pneumonia

Alisa 2 2 2 2 2 1 2 2 2 Pneumonia

Adinda 3 3 2 1 2 2 2 2 1 Pneumonia
non
Reva 2 2 2 2 2 1 1 2 1 pneumonia

Zahra 2 2 2 2 3 2 1 2 2 Pneumonia

Paris 2 2 1 2 2 2 2 1 2 Pneumonia

Danis 3 2 2 2 2 2 1 2 2 Pneumonia
non
Khairul 2 2 1 1 1 2 2 2 2 pneumonia

Laila 3 2 1 2 2 2 2 2 2 Pneumonia

Ahmad 2 2 2 2 2 2 1 2 2 Pneumonia

2. Variabel Data
Variabel yang terdapat pada data penelitian ini meliputi variabel input dan
variabel output atau target.
a. Variabel Input
Variabel input merupakan variabel yang dinyatakan sebagai data
penyakit ISPA serta faktor-faktor yang meempengaruhi terjadinya
penyakit ISPA non pneumonia atau pneumonia. Berikut ini adalah
variabel input yang terdapat pada data penyakit ISPA yang akan
digunakan untuk mengklasifikasikan penyakit ISPA non pneumonia atau
pneumonia adalah nama, umur, berat, batuk, flue, demam, nafas berat,
tenggorokan merah, status gizi, lingkungan rokok dan class.
3

b. Variabel Target
Variabel target meyatakan sebagai hasil dari penilaian yang dilakukan
terhadap variabel input. Sedangkan variabel target dari hasil penelitian
ini adalah atribut “Class” yang diberikan label “Non pneumonia dan
Pneumonia”.
3. Penjelasan Data
Setelah data dikumpulkan maka dilakukan pembelajaran mengenai data
yang akan digunakan. Data diharapkan dapat mmembantu penulis dengan data-
data yang sudah dikumpulkan dapat menemukan wawasan awal mengenai
informasi yang bisa didapatkan didalamnya.

3.6.1 Pengelolaan Data Awal


Pengolahan awal pada data penelitian ini akan mencakup semua kegiatan
untuk mempersiapkan data sebelum masuk proses pemodelan. Dalam melakukan
pengelolaan data awal, akan dilakukan beberapa tahapan agar pada akhirnya
akan didapatkan data yang bisa digunakan pada tahap berikutnya. Tahapan
tersebut diantaranya adalah sebagai berikut: select data, transformation,
cleaning serta akan dilakukan cross validation.
1. Select Data
Data yang sudah ada selanjutnya akan dilakukan pemilihan terhadap
parameter yang akan dianalisis. Parameter yang diambil adalah atribut yang
terdiri 9 atribut dari data penyakit ISPA yang telah didapatkan pada tahap
sebelumnya. Pemilihan parameter ini dengan mempelajari lebih lanjut setiap
atribut dengan mempertimbangkan tujuan penulisan, maka akan didapatkan
atribut-atribut yang akan digunakan untuk menjadi masukan atau variabel input.

Tabel 3.4 Pemilihan Data

Atribut Indikator Detail Penggunaan

Nama X -

Umur Y Nilai Variabel

Berat Y Nilai Variabel


3

Batuk Y Nilai Variabel

Flue Y Nilai Variabel

Demam Y Nilai Variabel

Nafas Berat Y Nilai Variabel

Tenggorokan
Y Nilai Variabel
Merah
Status Gizi Y Nilai Variabel

Lingkungan
Y Status Target
Rokok

Pada tabel diatas menjelaskan tribut yang akan dipakai dalam penelitian ini.
Indikator “Y” menadakan bahawa atribut tersebut akan digunakan, sedangkan
atribut “X” menandakan bahwa atribut tersebut akan di eliminasi pada tahap
pengolahan data awal. Eliminasi akan dilakukan berdasarkan nilai model yang
relative antara satu data penyakit ISPA dengan data yang lainnya, sehingga tidak
akan berpengaruh terhadap hasil.
2. Transformation
Setelah data sudah dipilih maka akan dilakukan tahapa berikutnya yaitu
transformasi terhadap atribut, transformasi akan dilakukan untuk memodifikasi
sumber data ke format berbeda yang dapat diterima oleh proses data mining
pada tahapan selanjutnya. Tranformasi nilai-nilai dari atribut juga perlu
dilakukan karena jangkauan nilainya terlalu lebar, sehingga dapat menyebabkan
proses pengenalan pola data dan pembentukan pohon keputusan menjadi lambat.
Ada berbagai macam jenis atribuut pada data mining, diantaranya yaitu:
a. Atribut Nominal adalah simbol atau nama-nama dari suatu benda, setiap
nilai merupakan semacem kategori, kode, atau status dan sebagainya
sehingga atribut ini juga disebut sebagai kategorikal.
b. Atribut Biner adalah atribut nominal yang hanya berisi dua jenis nilai saja.
3

c. Atribut Ordinal adalah atribut dengan nilai-nilai yang memilliki urutan


satau peringkat, tapi besaran nilai-nilai yang berurutan tidak diketahui.
d. Atribut Numerik adalah kuantitatif artinya nilai atribut itu bisa diukur,
disajikan dalam bentuk integer atau desimal.

Pada penelitian ini jenis atribut yang ada pada data awal berupa atribut
nominal (umur, berat badan, demam), ordinal (nama), biner (tenggorokan merah,
lingkungan rokok, status gizi, nafas berat, batuk dan flue), dari atribut yang ada
selanjutnya atribut akan ditransformasi ke dalam bentuk atribut numerik agar
memudahkan dalam proses pemodelan. Berikut ini merupakan transformasi yang
dilakukan pada atribut yaitu:

Tabel 3.5 Umur

Keterangan Penyederhanaan

Bayi (0-1Tahun) 1

Balita (2-3 Tahun) 2

Anak (4-5 Tahun) 3

Tabel 3.6 Berat

Keterangan Penyederhanaan

Ringan (5-10 Kg) 1

Sedang (10-20 Kg) 2

Berat (20-25 Kg) 3

Tabel 3.7 Batuk

Keterangan Penyederhanaan

Tidak 1

Ya 2
3

Tabel 3.8 Flue

Keterangan Penyederhanaan

Tidak 1

Ya 2

Tabel 3.9 Demam

Keterangan Penyederhanaan

Normal (< 37 Derajat) 1

Panas (> 38 Derajat) 2

Sangat Panas (< 40 Derajat) 3

Tabel 3.10 Nafas Berat

Keterangan Penyederhanaan

Tidak 1

Ya 2

Tabel 3.11 Tenggorokan Merah

Keterangan Penyederhanaan

Tidak 1

Ya 2

Tabel 3.12 Status Gizi

Keterangan Penyederhanaan
3

Kurang 1

Cukup 2

Tabel 3.13 Lingkungan Rokok

Keterangan Penyederhanaan

Tidak 1

Ya 2

3. Cleaning
Pada tahapan berikut ini akan dilakukan proses pembersihan data untuk
memastikan data yang telah dipilih itu layak atau tidak untuk dilakukan
pemodelan. Kegiatan yang ada pada tahap ini antara lain untuk membersihkan
dan memperbaiki data rusak, menghapus data yang tidak diperlukan serta
memperbaiki data rusak. Pada tahap ini akan dilakukan menghilangkan atribut
nama, tahun, bulan, C dan kg yang akan digunakan pada proses pemodelan.

Tabel 3.14 Proses Cleaning Data


Nafas
Umur Berat Batuk Flue Demam Tenggorokan Status Lingkungan
Berat Merah Gizi Rokok Class
non
3 2 1 2 1 1 2 2 2 pneumonia
non
3 3 1 1 1 2 1 2 1 pneumonia
3 2 2 2 2 2 2 2 2 Pneumonia
non
3 3 2 1 1 1 2 1 2 pneumonia
non
3 2 1 2 1 1 2 2 2 pneumonia
2 2 1 1 3 2 2 1 1 Pneumonia
3 2 1 2 2 2 1 1 2 Pneumonia
2 2 2 1 2 2 1 1 2 Pneumonia
2 1 2 1 2 2 1 2 2 Pneumonia
2 2 1 2 2 2 2 1 1 Pneumonia
non
1 1 1 2 1 1 1 2 1 pneumonia
2 2 2 2 2 1 2 2 2 Pneumonia
3 3 2 1 2 2 2 2 1 Pneumonia
3

non
2 2 2 2 2 1 1 2 1 pneumonia
2 2 2 2 3 2 1 2 2 Pneumonia
2 2 1 2 2 2 2 1 2 Pneumonia
3 2 2 2 2 2 1 2 2 Pneumonia
non
2 2 1 1 1 2 2 2 2 pneumonia
3 2 1 2 2 2 2 2 2 Pneumonia
2 2 2 2 2 2 1 2 2 Pneumonia

4. Cross Vallidation

Pengujian cross Validation menggunakan k-fold cross validation. Cross-


validation adalah bentuk sederhana dari teknik statistik. Jumlah fold standar
untuk memprediksi tingkat error dari data adalah dengan menggunakan 10-fold
cross validation. teknik validasi yang membagi data menjadi dua bagian secara
acak, sebagian sebagai data training dan sebagian lainnya sebagai data testing.
Dengan menggunakan cross Validation akan dilakukan percobaan training. Data
training adalah data yang akan dipakai dalam melakukan pembelajaran
sedangkan data testing adalah data yang belum pernah dipakai sebagai
pembelajaran dan akan berfungsi sebagai data pengujian kebenaran atau
keakurasian hasil pembelajaran(I. H. Witten et al, 2011). 10 Fold Cross
Validation merupakan salah satu metode pengujian yang digunakan untuk
pembelajaran terlatih (supervised learning). Setiap fold dibagi menjadi beberapa
subset dengan ukuran sama pada tiap subsetnya. Kemudian akan dilakukan
training sebanyak 10 kali dengan menggunakan 9 fold untuk training set dan 1
fold digunakan sebagai test set, (Defiyanti & Kom, 2013).

Nilai k yang digunakan yaitu 5 atau 10, biasa disebut 10 folds cross
validation, yaitu data dibagi menjadi 10 bagian , 90% untuk training dan 10%
lainnya digunakan sebagai testing. Proses dilakukan berulang sampai dengan 10
kali atau 10 iterasi sampai semua record data mendapatkan bagian sebagai data
testing(Indrayanti, Sugianti, & Karomi, 2017).

Berikut gambar 3.3 representasi dari 10 folds cross validation.


3

Gambar 3.4 Representasi 10 Fold Cross Validation


Sumber Indrayanti et al., (2017)

Pembagian data dengan cara kerja k-folds cross validation, yaitu total data
dibagi menjadi n bagian, iterasi atau fold ke 1, yaitu bagian ke 1 menjadi testing,
bagian sisanya menjadi data training interval sampel atau juga disebut sampling
rasio di peroleh dengan cara membagi ukuran sampel yang dikehendaki (N/n).
Pada fold ke 2, dimana bagian ke 2 yang menjadi testing, sisanya menjadi
training, kemudian hitung akurasinya, proses tersebut berulang sampai
mencapai fold ke -
k. Hitung rata-rata dari semua nilai k, hasil akurasi tersebut merupakan hasil
akurasi akhir.

Pada proses validasi hasil klasifikasi, pada penelitian ini dilakukan dengan
menggunakan metode decision tree C4.5 pada data training. Setelah itu
dilanjutkan proses evaluasi dengan confusion table dan ROC curve. Hasil
confusion table digunakan untuk menyajikan accuracy, recall, dan precision
dalam algortima klasifikasi. Accuracy merupakan persentase antara nilai prediksi
dengan nilai sebenarnya yang ada. Recall merupakan persentase nilai kinerja
keberhasilan algoritma yang dipakai. Precision merupakan nilai akurasi dengan
class yang telah diprediksi. Berikut merupakan tabel confusion dapat dilihat
pada tabel berikut ini:
3

Tabel 3.15 Confusion Tabel

Nilai Prediksi
Confusion Matrix
Non
Pneumonia= Pneumonia= p

NP
Non

Nilai Pneumonia= TNP FNP

Sebenarnya NP
Pneumonia = P FP TP

TNP+TP
Rumus Accuracy: Accuracy =
(TNP+FNP+TP+FP)
TNP
Rumus Recall: Recall =
(TNP+FP)
TNP
Rumus Precision: Precision =
(TNP+FNP)

Keterangan: TNP : True Non Pneumonia FNP : False Non Pneumonia

FP : False Pneumonia TP : True Pneumonia

Receiver Operating Characteristic (ROC) digunakan untuk evaluasi hasil


akurasi dalam bentuk grafik. ROC merupakan kurva yang akan menghasilkan
nilai Area Under Curve (AUC). AUC merupakan nilai akurasi area dibawah
kurva yang dihasilkan oleh ROC, (Saifudin & Wahono, 2015). Menurut
(Silalahi, Murfi, & Satria, 2017), keakurasian nilai AUC dapat diklasifikasi
menjadi 5 kelompok antara lain, yaitu :

1. 0.90 – 1.00 = Exellent Classisfication

2. 0.80 – 0.90 = Good Classification

3. 0.70 – 0.80 = Fair Classification


3

4. 0.60 – 0.70 = Poor Classification

5. 0.50 – 0.60 = Failure

5. Pemodelan
Pada penelitian ini akan dilakukan pemodelan menggunakan metode
algoritma C4.5 untuk pengolahan data penyakit ISPA. Berikut ini beberapa
tahapan proses pemodelan dalam penelitian ini yaitu:
1. Choosing The Appropriate Data Mining Task
Pada tahapan ini memilih jenis data mining yang digunakan. Pada
penelitian untuk prediksi penyakit ISPA yang terkena pneumonia makan
dipilih jenis data mining yang digunakan adalah klasifikasi.
2. Choosing The Data Mining Algoritma
Tahap ini setelah pemilihan jenis data mining yang dilakukan yaitu
klasifikasi, maka selanjutnya menentukan algoritma klasifikasi yang akan
digunakan. Pada penelitian ini menggunakan algoritma C4.5.
3. Employing The Data Mining Algoritma
Tahap ini dilakukan untuk pengolahan data mining dengan tingkat
akurasi yang tinggi dalam klasifikasi prediksi penyakit ISPA non
pneumonia atau pneumonia.
4. Evaluation
Pada tahap ini dilakukan evaluasi dan menafsirkan pola yang didapatkan
dari hasil algoritma yang dipakai untuk mengetahui faktor, gejala dan lain-
lain. Evaluasi yang dilakukan ini menerapkan pola yang didapat dari proses
sebelumnya terhadap data testing yang di sediakan. Evaluasi dilakukan
dengan confusion matrix dan kurva ROC.
5. Using The Discovered Knowledge
Pada tahapan ini menggunakan pengetahuan yang didapat dari proses
data mining untuk penerapan pada aplikasi atau yang lainnya. Pengetahuan
klasifikasi untuk memprediksi penyakit ISPA non pneumonia atau
pneumonia yang diterapkan pada data baru untuk membuat klasifikasi
penyakit ISPA non pneumonia dan juga pneumonia.
BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian


Hasil penelitian dilakukan dengan menggunakan aplikasi Rapidminer 8.2.1
dengan jumlah data sebanyak 160 data. Berikut ini adalah hasil dari pengujian
yang dilakukan.

4.1.1 Evaluasi dan Validasi hasil Algoritma C4.5


Data yang digunakan pada penelitian ini adalah sebanyak 160 data yang
diambil dari data pasien. Langkah pembuatan pohon keputusan (Desicion Tree),
pada langkah awal dari proses evaluasi algoritma C4.5. Data penyakit ISPA
yang akan diproses adalah dataset keseluruhan, untuk melakukan pengelolaan
data di Rapidminer. Dataset keseluruhan pada penyakit ISPA akan
disajukan pada lampiran (halaman 58-61).

4.1.2 Perhitungan Algoritma C4.5


Menghitung nood (akar) terlebih dahulu pada dataset untuk mendapatkan
hasil entropy total pada pohon keputusan, dapat dilihat pada tabel berikut ini:

Tabel 4.16 Entropy Total

Hasil Frekuensi Pj LOG 2*PJ -Pj*LOG 2 *Pj


Pneumonia 122 0.7625 -0.3912 0.2983
non pneumonia 38 0.2 -2.0740 0.4926
Total 160 0.790858091

Setelah hasil entropy total diketahui maka selanjutnya mencari hasil entropy
dan gain pada masing-masing atribut untuk menentukan akar pohon pada dataset
penyakit ISPA. Berikut ini tabel hasil perhitungan entropy atribut untuk
menentukan akar pohor pada Decision Tree C4.5:

39
4

Tabel 4.17 Perhitungan Pohon Keputusan Menentukan Nood (Akar)

Label
Atributte Value Jml kasus Entropy Gain Ratio
non
Pneumonia pneumonia
Entropy total 122 38 160 0.790858091
Umur 0.00941298

1 39 17 56 0.885612871
2 45 12 57 0.742487570
3 38 9 47 0.704576713
Berat 0.007869026

1 43 15 58 0.824657833
2 69 22 91 0.797951968
3 10 1 11 0.439496987
Batuk 0.000832445

1 31 11 42 0.829607103
2 91 27 118 0.775937331
-
Flue 0.011219068

1 23 6 29 0.802077159
2 99 32 131 0.802077159
Demam 0.27837428

1 6 21 27 0.764204507
2 68 17 85 0.721928095
3 48 0 48 0
Nafas Berat 0.159393135

1 12 22 34 0.936667382
2 110 16 126 0.549108745
Tenggorokan
0.021838137
Merah
1 45 7 52 0.569961376
2 77 31 108 0.864862972
Status Gizi 0.001160594

1 13 3 16 0.69621226
2 109 35 144 0.800084745
Lingkungan Rokok 0.015206356
1 37 6 43 0.583019417
2 85 32 117 0.846448228
4

Tabel 4.18 Nilai Gain Pada Cabang Umur


Label
Atributte Value Jml
non Entropy Gain Ratio
Pneumonia kasus
pneumonia
Umur 0.253345473
1 0 7 7 0
2 0 6 6 0
3 6 8 14 0.985228136

Tabel 4.19 Nilai Gain Pada Cabang Lingkungan Rokok


Label
Jml
Atributte Value non Entropy Gain Ratio
Pneumonia kasus
pneumonia
Lingkungan
0.198117421
Rokok
1 2 0 2 0
2 4 8 12 0.918295834

Tabel 4.20 Nilai Gain Pada Cabang Batuk


Label
Atributte Value non Jml
Pneumonia Entropy Gain Ratio
pneumonia kasus

Batuk 0.168590632
1 3 2 5 0.970950594
2 1 6 7 0.591672779

Tabel 4.21 Nilai Gain Pada Cabang Nafas Berat


Label
Atributte Value non Jml
Pneumonia Entropy Gain Ratio
pneumonia kasus

Nafas Berat 0.080217192


1 8 8 16 1

2 60 9 69 0.558629373

Tabel 4.22 Nilai Gain Pada Cabang Berat


Label
non Jml
Atributte Value Entropy Gain Ratio
Pneumonia kasus
pneumonia

Berat 0.16970017
1 2 4 6 0.918295834
2 4 3 7 0.985228136
3 2 0 2 0
4

Tabel 4.23 Nilai Gain Pada Cabang Tenggorokan Merah


Label
Atributte Value non Jml
Pneumonia Entropy Gain Ratio
pneumonia kasus
Tenggorokan
Merah 0.316689088
1 1 0 1 0
2 1 4 5 0.721928095

Tabel 4.24 Nilai Gain Pada Cabang Batuk


Label
non Jml
Atributte Value Entropy Gain Ratio
Pneumonia kasus
pneumonia

Batuk 0.469565211
1 0 2 2 0
2 4 1 5 0.721928095

Tabel 4.25 Nilai Gain Pada Cabang Umur


Label
non Jml
Atributte Value Entropy Gain Ratio
Pneumonia kasus
pneumonia

Umur 0.721928095
1 0 1 1 0
2 4 0 4 0
3 0 0 0 0

Tabel 4.26 Perhitungan Akhir Entropy dan Gain

Label
Atributte Value Jml kasus Entrophy Gain Ratio
Pneumonia non pneumonia

Entropy Batuk 4 1 5 0.721928095


Umur 0.72192809

1 0 1 1 0

2 4 0 4 0
3 0 0 0 0
Flue 0
1 0 0 0 0.721928095
2 4 1 5 0.721928095
Tenggorokan
Merah 0.0729056

1 1 0 1
0
4

2 3 1 4 0.811278124
Status Gizi 0
1 0 0 0 0
2 4 1 5 0.721928095
Lingkungan
Rokok 0.32192809

1 1 1 2 1
2 3 0 3 0

4.1.3 Pengelolaan Dataset


Langkah awal pengelolaan dataset adalah read excel cari pada kolom
operators. Lalu drag ke kolom process gambar read excel dataset yang disajikan
pada gambar 4.1 berikut ini:

Gambar 4.1 Read Excel

Klik read excel lalu pada pojok kanan atas klik import configuration wizard.
Setelah itu pilih dataset, pemilihan dataset disajikan pada gambar 4.2 sebagai
berikut ini:
4

Gambar 4.2 Pemilihan Dataset

Klik tombol next, lalu next lagi, setelah itu pilih hasil keputusan binominal
dan label, dari 10 atribut yang digunakan 9 atribut dan 1 atribut menjadi atribut
class. Sedangkan yang lainnya sebagai integer dan atribut. Setelah itu klik
finish. Lalu pilih cross validation pada kolom operators, dan pada kolom cross
validation klik dua kali untuk proses pada cross validation. Gambar pemilihan
hasil keputusan sebagai tabel (dataset ISPA) disajikan pada gambar 4.3 sebagai
berikut ini:

Gambar 4.3 Pemilihan Hasil Keputusan Sebagai Tabel (Dataset)


4

Pada penelitian ini dilakukan proses validasi menggunakan fitur cross


validation dengan nilai k = 10 folds. Berikut merupakan permodelan yang ada
didalam cross validation.

Gambar 4.4 Model Cross Validation dengan Decision Tree C4.5

Pada permodelan cross validation didalamnya terdapat dua bagian, yaitu


bagian training dan testing. Bagian training digunakan untuk algoritma
klasifikasi Decision Tree dan bagian testing menggunakan fitur Apply Model
untuk mengaplikasikan model pada data testing dan fitur Performance untuk
menampilkan confusion table, yang digunakan untuk menampilkan hasil dari
accuracy, recall, precision, dan nilai AUC.

Setelah itu klik proses untuk masuk ke gambar read excel dan validation.
Tarik garis dan sambung pada setiap kotaknya, pada kotak validation sambung
empat garis. Setelah proses dilakukan klik start the execution (segitiga biru
diatas) yang ada pada border untuk proses run. Pada gambar 4.5 berikut :
4

Gambar 4.5 Start The Execution

Setelah proses dilakukan akan mendapatkan hasil. Hasil confusion table


menggunakan klasifikasi Decision Tree C4.5, menghasilkan nilai pengukuran
confusion matrix class accuracy recall, precision, dan nilai AUC. Berikut hasil
dari confusion table akan ditunjukan pada gambar berikut ini:
1. Accuracy
Hasil accuracy menggunakan algoritma klasifikasi Decision Tree C4.5
dalam pengujian dengan cross validation yaitu sebesar 83,75% dengan +/-
11.59% serta mikro 83.75%. Dapat dilihat pada gambar berikut:

Gambar 4.6 Hasil Accuracy Decision Tree C4.5


4

2. Recall
Hasil Recall pada pengujian menggunakan algoritma klasifikasi Decision
Tree C4.5 adalah 63.50%, dengan 90.98% pada class pneumonia dan 60,53%
pada class non pneumonia, terlihat pada gambar berikut:

Gambar 4.7 Hasil Recall Decision Tree C4.5

3. Precision
Hasil precision pada pengujian menggunakan algoritma klasifikasi
Decision Tree C4.5 adalah 73.10%, dengan 88.10% pada class pneumonia dan
67.65% pada class non pneumonia, terlihat pada gambar berikut:

Gambar 4.8 Hasil Precision Decision Tree C4.5

4. AUC (Area Under Curve)


Nilai dari Kurva ROC (Receiver Operating Characteristic) diukur
terlebih dahulu terhadap AUC (Area Under Curve) yang dihasilkan pada model
pengujian ini yaitu sebesar 0,790. Angka tersebut termasuk kedalam kelompok
dengan range 0,700- 0,800 yang artinya menunjukkan hasil yang cukup dalam
akurasi.
4

Gambar 4.9 Hasil AUC (Area Under Curve) Decision Tree C4.5

Berikut deskripsi dari permodelan yang dihasilkan Decision Tree untuk


mengetahui performance terhadap vektor yang diperoleh dari Dataset sebagai
berikut:

PerformanceVector

PerformanceVector:
accuracy: 83.75% +/- 11.59% (mikro: 83.75%)
ConfusionMatrix:
True: pneumonia non pneumonia
pneumonia: 111 15
non pneumonia:11 23
AUC (optimistic): 0.938 +/- 0.076 (mikro: 0.938) (positive
class: non pneumonia)
AUC: 0.790 +/- 0.153 (mikro: 0.790) (positive class: non
pneumonia)
AUC (pessimistic): 0.669 +/- 0.228 (mikro: 0.669) (positive
class: non pneumonia)
precision: 73.10% +/- 25.84% (mikro: 67.65%) (positive class:
non pneumonia)
ConfusionMatrix:
True: pneumonia non pneumonia
pneumonia: 111 15
non pneumonia:11 23
4

recall: 63.50% +/- 26.38% (mikro: 60.53%) (positive class: non


pneumonia)
ConfusionMatrix:
True: pneumonia non pneumonia
pneumonia: 111 15
non pneumonia:11 23

Berikut meta data view dataset disajikan pada Gambar sebagai berikut:

Gambar 4.10 Meta Data View (Dataset)

Berikut gambar yang menunjukkan permodelan Decision Tree C4.5 :


5

Gambar 4.11 Permodelan Pohon Keputusan (Decision Tree) Algoritma C4.5

Berdasarkan Decision Tree maka diperoleh rule untuk klasifikasi prediksi


penyakit ISPA yaitu:
Tabel 4.27 Rule Klasifikasi Prediksi
Kode Keterangan Hasil Rule
Rule
R1 Jika demam ≤1.500dan jika umur ≤2.500 maka non
pneumonia.
R2 Jika demam >1.500 dan jika nafas berat >1.500maka
pneumonia.

R3 Jika demam >1.500 dan jik nafas berat ≤1.500 dan jika berat
>2.500 maka pneumonia.
5

R4 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah ≤2.500 maka pneumonia.

R5 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah >1.500 dan jika batuk
≤1.500 non pneumonia.

R6 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah >1.500 dan jika batuk
>1.500 dan jika umur ≤1.500 maka pneumonia.

R7 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah >1.500 dan jika batuk
>1.500 dan jika umur ≤1.500 maka non pneumonia.

R8 Jikademam ≤1.500 dan jika umur >2.500 dan jika lingkungan


rokok >1.500 dan jika batuk ≤1.500 maka pneumonia.

R9 Jika demam ≤1.500 dan jika umur >2.500 dan jika lingkungan
rokok ≤1.500 maka pneumonia.

R10 Jika demam ≤1.500 dan jika umur >2.500 dan jika lingkugan
rokok >1.500 dan jika batuk >1.500 maka non pneumonia.

Pada pohon keputusan (Decision Tree) algoritma C4.5 penyakit ISPA jika
dijabarkan kedalam bahasa yang lebih sederhana dan dibuat dalam bentuk pohon
text maka akan diperoleh hasil sebagai berikut:
5

Tree

Demam > 1.500


| Nafas Berat > 1.500: pneumonia {pneumonia=108, non
pneumonia=9}
| Nafas Berat ≤ 1.500
| | Berat > 2.500: pneumonia {pneumonia=2, non pneumonia=0}
| | Berat ≤ 2.500
| | | Tenggorokan Merah > 1.500
| | | | Batuk > 1.500
| | | | | Umur > 1.500: pneumonia {pneumonia=3, non
pneumonia=1}
| | | | | Umur ≤ 1.500: non pneumonia {pneumonia=1, non
pneumonia=3}
| | | | Batuk ≤ 1.500: non pneumonia {pneumonia=0, non
pneumonia=4}
| | | Tenggorokan Merah ≤ 1.500: pneumonia {pneumonia=2, non
pneumonia=0}
Demam ≤ 1.500
| Umur > 2.500
| | Lingkungan Rokok > 1.500
| | | Batuk > 1.500: non pneumonia {pneumonia=1, non
pneumonia=6}
| | | Batuk ≤ 1.500: pneumonia {pneumonia=3, non
pneumonia=2}
| | Lingkungan Rokok ≤ 1.500: pneumonia {pneumonia=2, non
pneumonia=0}
| Umur ≤ 2.500: non pneumonia {pneumonia=0, non pneumonia=13}

4.1.4 Menghitung Entropy Split Dataset


Menghitung nilai Entropy Split keseluruhan dari penyakit ISPA Non
Pneumonia atau Pneumonia dalam memprediksi penyakit ISPA dari Dataset
yang diketahui total data keseluruhan berjumlah 160 data. Yang akan dihitung
Entropy Splitnya, dalam Dataset penyakit ISPA terdapat 38 yang Non
Pneumonia dan 122 yang Pneumonia. Rumus Entropy Splitnya adalah sebagai
berikut:
Entropy Split = (-Total non pnemonia/Total dataset) * Log2 (Non
pneumonia/Total dataset) + (-Total pneumonia/Total
dataset) * Log2 (Pneumonia/Total dataset)
Entropy Split = (-38/160)*Log2 (38/160)+(-122/160)*Log2(122/160)
Entropy Split = (-0,23)*Log2(2,1202)+(-0,76)*Log2(0,3959)
Entropy Split = 0,4876+0,3008
Entropy Split = 0,7908

4.2 Pembahasan
5

Penelitian dilakukan dengan menggunakan algoritma klasifikasi Decision


Tree C4.5 dengan menghasilkan nilai accuracy, recall, precision, dan AUC.
Berikut tabel hasil dari penelitian yang telah dilakukan:

Tabel 4.28 Hasil Penelitian

Pengujian
Criterion
Decision
Accuracy 83,75%

Recall 63,50%

Precision 73,10%

AUC 0,790

Berdasarkan hasil penelitian diperoleh nilai accuracy, recall, precision, dan


nilai AUC. Dari hasil yang telah didapat penelitian mengenai klasifikasi dalam
penyakit ISPA menggunakan algoritma C4.5dengan kurva ROC mendapatkan
nilai akurasi fair classification sebesar 0,790.
BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan
Berdasarkan hasil penelitian yang telah dilakukan menggunakan
penambangan data algoritma C4.5 untuk mengklasifikasi penyakit ISPA Non
Pneumonia atau Pneumonia, dapat diambil kesimpulan sebagai berikut:
1. Data Mining untuk mengklasifikasi penyakit ISPA Non Pneumonia atau
Pneumonia dapat diimplementasikan dengan baik menggunakan algoritma
C4.5 pada rapidminer.
2. Pengujian yang dilakukan terhadap 160 data menggunakan confusion matrix
dan ROC curve menghasilkan tingkat keakuratan sebesar 0.790% dengan
+/- 0.153% serta mikro 0.790%. Jika melihat dengan kurva ROC
menggunakan dataset dengan akurasi fair classification sebesar 0.790. Nilai
keakuratan tersebut dapat dikatakan cukup untuk digunakan dalam
memprediksi jenis penyakit ISPA.

5.2 Saran
Saran yang dapat diberikan untuk mengembangkan penelitian yang akan
datang adalah :
1. Pendekatan klasifikasi yang mampu menerima masukan dengan jumlah
atribut yang bervariasi di penelitian mendatang.
2. Penelitian selanjutnya diharapkan dapat mengembangkannya dalam suatu
aplikasi.
3. Memaksimalkan atau menambah dataset yang lebih banyak agar prediksi
data penyakit ISPA Non Pneumonia atau Pneumonia semakin akurat.

54
5

DAFTAR PUSTAKA

Anonim,(2008). Program Pemberantasan Penyakit ISPA untuk penanggulangan


Pnemonia Pada Balita Dalam Pelita VI Jakarta.
Badan Penelitian dan Pengembangan Kesehatan. 2013. Riset Kesehatan Dasar
2013. Jakarta : Kementerian Kesehatan RI.
Bundanis Dwi Meilani Achmad, “Klasifikasi Data Karyawan Untuk Menentukan
Jadwal Kerja Mengunakan Metode Decision Tree”, IPTEK, Vol.16 No.1,
PP. 17-23, Mei 2012.
Daniel T.Larose. 2005. Discovering Knowledge in Data An Introduction to Data
Mining. Willey Interscience, New Jersey.
Danusantoso, H. (2012). Ilmu Pnyakit Paru Edisi 2. Jakarta: EGC
Defiyanti, S., & Kom, M. (2013). Analisis dan Prediksi Kinerja Mahasiswa
Menggunakan Teknik Data Mining. Syntak, 2, 1–10.
Depkes. (2004). Angka Kematian Bayi Masih Tinggi. Depkes. (2004). Etiologi
ISPA dan Pneumonia.
Depkes RI. 2004. Pedoman Pemberantasan Penyakit ISPA Untuk Penangulangan
Pneumonia Pada Balita. Jakarta: Departemen Kesehatan RI.
Depkes RI. 2010. Pedoman Pengendalian Infeksi Saluran Pernapasan Akut Untuk
Menanggulangi Pneumonia Pada Balita. Jakarta : Departemen Kesehatan RI.
Depkes RI. Profil Kesehatan Indonesia 2010. Jakarta, 2011.
Depkes RI. 2012. Pedoman Pengendalian Infeksi Saluran Pernapasan Akut.
Jakarta : Dirjen Pengendalian Penyakit Penyehatan Lingkungan.
Direktorat Jenderal Pengendalian Penyakit dan Penyehatan Lingkungan (P2PL).,
2011. Pedoman Pengendalian Infeksi Saluran pernapasan Akut. Jakarta :
Kementerian Kesehatan RI.
Dini.S.K, 2014. Penentuan Pola Hubungan Antar Rawi Hadis Menggunakan
Metode Association Rules Dengan Algoritma Apriori Skripsi. Jurusan
Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas
Islam Indonesia, Yogyakarta.
F. A. Hermawati, (2013). Data Mining, Yogyakarta: Andi.

Fadlina, 2014. Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan
Algoritma Association Rule Metode Apriori. Informasi dan Teknologi
Ilmiah(INTI). Vol 3 No.1, Mei 2014.
Fadillah, Sarah. (2013). “Implementasi Data Mining Untuk Pengenalan
Karakteristik Transaksi Customer Dengan Menggunakan Algoritma C4.5.”
Pelita Informatika Budi Darma, Vol. 5, No. 3. 2301-9425.
5

G.Liang , 2005. "A Comparative Study of Three Decision Tree Algoritms ID3,
Fuzzy ID3 and Probabilistic Fuzzy ID3," Rotterdam University ,
Netherlands.
Gorunescu, F., 2011. “Data Mining Concept Model and Techniques”, Berlin:
Springer.
Hidayat N. 2009. Faktor-Faktor Yang Berhubungan Dengan Kejadian Penyakit
IspaPada Balita Di Kelurahan Pasie Nan Tigo Kecamatan Koto Tangah
KotaPadang.
Hidayat, M. N, (2009). Hubungan Lingkungan Fisik Rumah Dengan Kejadian
ISPA.
I. H. Witten, E. Frank, and M. A. Hall. 2011. Data Mining Practical Machine
Learning Tools and Technique. Burlington: Morgan Kaufmann Publisher.

Indrayanti, Sugianti, D., & Karomi, M. A. Al. (2017). Optimasi Parameter K Pada
Algoritma K-Nearest Neighbour untuk Klasifikasi Penyakit Diabetes
Mellitus, 551–554.
Jantan, Hamidah., Razak Hamdan., Abdul dan Ali Othman, Zulaiha. (2010).
“Human Talent Prediction in HRM using C4.5 Classification Algorithm.”
International Journal on Computer Science and Engineering, Vol. 02, No.
08. 2526-2534.

K. and E. T. Luthfi. 2009. Algoritma Data Mining, Yogyakarta: Andi.

Kochet al. 2003. Housing and Health : Time Again for Public Health Action.
American Journal of Public Health: May, Vol 92, No 5. p 758-768.
Kusrini dan Taufiq Luthfi, Emha. (2009). “ Algoritma Data Mining.” Yogyakarta:
Andi.

Lianto, Joko., Umi Hanik, dan AhmadSaikhu, 2011. “Fuzzy Decision Tree dengan
Algoritma C4.5 Pada data Diabetes Indian Pima”, Sistem dan
Informatika,pp. 1-3, 2011.
Permatasari, C.A.E. 2009. Faktor Risiko Gejala ISPA Ringan pada Baduta di
Rangkapan Jaya Baru Kota Depok 2008. Universitas Indonesia. Depok
Prameswari, G.N. 2009. Hubungan Lama Pemberian Asi Secara Ekslusif Dengan
Frekuensi Kejadian ISPA. Universitas Negeri Semarang, Indonesia. Jurnal
Kesehatan Masyarakat 5 : 30.
Prasetyo.E, 2014. Data Mining Mengolah Data Menjadi Informasi Menggunakan
Matlab. Andi. Yogyakarta.
Ranuh, IGN. (1997). Masalah ISPA dan Kelangsungan Hidup Anak. Surabaya :
Continuing Education. Ilmu Kesehatan Anak.
Rudianto. 2013. Faktor-faktor yang Berhubungan dengan Gejala Infeksi Saluran
Pernapasan Akut (ISPA) pada Balita di 5 Posyandu Desa Tamansari
Kecamatan Pangkalan Karawang Tahun 2013. Jakarta.
5

Saifudin, A., & Wahono, R. S. (2015). Penerapan Teknik Ensemble untuk


Menangani Ketidak Seimbangan Kelas pada Prediksi Cacat Software.
Journal of Software Engineering, 1.
Silalahi, D. K., Murfi, H., & Satria, Y. (2017). Studi Perbandingan Pemilihan
Fitur untuk Support Vector Machine pada Klasifikasi Penilaian Risiko
Kredit, 1(2), 119–136.
Surbekti Mujiasih, (2011). Pemanfaatan Data Mining Untuk Prakiraan Cuaca,
Jurnal Meteorologi dan Geofisika, Volume 12, Nomor 2, September 2011.
Singh, S., & Gupta, P. (2014). Comparative study ID3, cart and C4.5
Decisiontree algorithm: a survey. International Journal of Advanced
Information Science and Technology (IJAIST), 27(27), 97–103.
Turban Efraim, Aronson Jay E, and Liang. 2005. Decision Support Systems and
Intelligent Systems, 7th ed.: PrenticeHall, Upper Saddle River, NJ.
WHO (World Health Organization), (2007). Penanganan ISPA Pada Anak di
Rumah Sakit Kecil Negara Berkembang. Pedoman Untuk Dokter dan
Petugas Kesehatan Senior. Jakarta:EGC
5

LAMPIRAN
5

Bera Batu Flu Dema Nafas Tenggorokan Status Lingkunga


Umur Class
t k e m Berat Merah Gizi n Rokok
Pneumonia
3 2 1 2 1 1 2 2 2
Pneumonia
3 3 1 1 1 2 1 2 1
Pneumonia
3 2 2 2 2 2 2 2 2
non
3 3 2 1 1 1 2 1 2
pneumo
Pneumonia
3 2 1 2 1 1 2 2 2
Pneumonia
2 2 1 1 3 2 2 1 1
Pneumonia
3 2 1 2 2 2 1 1 2
Pneumonia
2 2 2 1 2 2 1 1 2
Pneumonia
2 1 2 1 2 2 1 2 2
Pneumonia
2 2 1 2 2 2 2 1 1
non
1 1 1 2 1 1 1 2 1
pneumo
pneumonia
2 2 2 2 2 1 2 2 2
pneumonia
3 3 2 1 2 2 2 2 1
pneumonia
2 2 2 2 2 1 1 2 1
pneumonia
2 2 2 2 3 2 1 2 2
pneumonia
2 2 1 2 2 2 2 1 2
pneumonia
3 2 2 2 2 2 1 2 2
non
2 2 1 1 1 2 2 2 2 pneumo
pneumonia
3 2 1 2 2 2 2 2 2
pneumonia
2 2 2 2 2 2 1 2 2
non
2 2 2 1 2 2 1 1 2 pneumo
non
2 2 1 2 1 1 2 2 1
pneumo
pneumonia
1 1 2 2 3 2 1 2 1
pneumonia
3 3 1 2 3 2 2 2 2
pneumonia
3 2 2 2 2 2 1 2 2
pneumonia
3 2 2 2 2 2 1 2 2
pneumonia
3 3 1 2 2 2 2 2 1
pneumonia
1 2 2 1 2 2 2 2 2
pneumonia
3 2 2 2 2 2 2 1 2
pneumonia
1 1 2 1 3 2 2 2 2
pneumonia
2 2 2 2 2 1 2 2 2
pneumonia
1 1 2 2 2 2 2 2 2
pneumonia
1 1 1 2 2 2 1 2 2
Pneumonia
2 2 2 2 3 2 1 2 1
6

Pneumonia
2 2 2 1 2 2 2 2 2
Pneumonia
2 2 2 1 3 2 1 2 2
Pneumonia
2 2 2 2 2 2 2 2 1
Pneumonia
2 2 1 2 3 2 2 2 2
non
2 1 2 2 1 1 2 2 2 pneumonia

non
1 1 2 2 2 1 2 2 2 pneumonia

Pneumonia
1 1 2 2 2 2 2 1 1
Pneumonia
2 2 2 2 2 2 1 2 2
non
1 1 1 2 2 1 2 2 2
pneumo
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
1 1 1 2 3 2 2 2 1
Pneumonia
3 3 2 2 2 2 2 2 2
Pneumonia
3 2 2 2 2 2 2 2 2
Pneumonia
2 1 2 2 2 2 1 2 1
Pneumonia
3 2 1 2 2 2 2 2 2
Pneumonia
1 1 2 2 3 2 1 1 2
Pneumonia
1 1 2 1 2 2 2 2 2
non
1 1 1 2 2 2 2 2 2
pneumo
pneumonia
1 1 2 2 2 2 1 2 1
pneumonia
3 3 2 2 2 2 2 1 2
Pneumonia
1 1 2 1 3 2 2 2 2
Pneumonia
2 2 1 2 2 2 2 2 2
Pneumonia
2 2 2 2 2 2 2 2 2
Pneumonia
2 2 2 2 3 2 2 1 2
Pneumonia
3 3 2 2 2 1 2 2 2
non
3 2 2 2 1 1 2 2 2 pneumo
Pneumonia
3 3 2 2 2 2 1 2 2
Pneumonia
3 2 1 2 3 2 2 2 1
Pneumonia
1 1 2 2 2 2 1 2 1
Pneumonia
2 2 2 2 3 2 1 2 1
non
3 2 2 2 1 2 1 2 2 pneumonia

non
2 2 2 1 2 2 2 2 2 pneumonia

Pneumonia
3 2 2 2 1 2 2 2 2
Pneumonia
2 2 1 2 2 2 2 2 2
Pneumonia
3 2 2 2 3 2 1 1 2
6

Pneumonia
2 2 2 2 2 2 1 2 2
Pneumonia
3 2 2 1 3 2 2 2 1
non
2 2 2 2 1 1 2 2 2
pneumo
non
2 2 1 2 2 1 2 2 2
pneumo
Pneumonia
1 2 2 1 2 2 2 2 2
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
1 1 2 2 3 2 2 2 1
Pneumonia
1 1 1 2 3 2 2 2 2
Pneumonia
1 1 2 2 2 1 2 2 2
Pneumonia
2 1 2 1 3 2 2 2 2
Pneumonia
1 1 2 2 3 2 2 1 2
Pneumonia
2 1 2 2 2 2 2 2 2
non
2 1 2 2 2 1 2 2 2 pneumonia

non
1 2 2 2 1 2 1 2 2 pneumonia

non
1 1 2 1 2 2 2 2 2 pneumonia

Pneumonia
2 2 2 2 3 2 1 2 1
Pneumonia
3 2 1 2 1 1 2 2 2
Pneumonia
3 2 2 2 3 2 1 2 2
Pneumonia
3 3 2 2 3 2 2 2 1
Pneumonia
2 2 2 2 2 2 1 2 2
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
3 2 2 2 3 2 2 2 1
Pneumonia
2 1 1 2 2 2 2 2 2
Pneumonia
2 2 2 2 2 2 2 2 2
non
3 2 2 2 1 2 2 2 2 pneumonia

Pneumonia
2 2 2 2 2 2 2 2 1
Pneumonia
1 1 2 1 3 2 2 2 2
Pneumonia
1 2 2 2 2 2 1 2 2
Pneumonia
1 1 2 2 3 2 1 2 1
Pneumonia
1 1 2 2 3 2 1 2 1
Pneumonia
2 2 2 2 3 2 2 2 1
Pneumonia
3 3 1 2 2 1 2 2 2
non
1 2 2 1 2 2 2 1 2 pneumonia

non
1 1 2 2 2 2 2 2 2 pneumonia
6

Pneumonia
1 1 2 2 2 2 2 2 1
Pneumonia
2 2 2 1 3 2 1 2 2
Pneumonia
2 2 1 2 2 2 2 2 2
Pneumonia
3 2 1 2 2 2 2 2 2
Pneumonia
2 2 1 2 3 2 2 2 2
Pneumonia
1 1 2 2 3 2 2 2 1
Pneumonia
2 2 2 2 2 2 2 2 1
non
1 1 2 2 2 2 2 2 2 pneumonia

non
1 1 1 2 2 1 2 2 2 pneumonia

Pneumonia
1 1 2 2 3 2 1 2 2
non
1 1 2 2 1 1 2 2 2 pneumo
Pneumonia
3 1 2 2 2 2 2 2 2
Pneumonia
1 1 2 2 2 2 1 2 2
Pneumonia
1 1 1 2 3 2 2 2 1
Pneumonia
1 1 2 1 3 2 1 2 2
Pneumonia
1 1 2 2 2 2 2 2 2
Pneumonia
1 1 2 2 2 2 2 2 2
Pneumonia
2 2 1 2 3 2 2 2 2
Pneumonia
2 2 1 2 3 2 2 2 2
Pneumonia
1 1 2 2 2 2 2 2 2
Pneumonia
3 2 2 2 2 2 2 2 2
Pneumonia
2 2 2 1 3 2 1 2 1
non
1 1 2 2 2 1 2 2 2 pneumonia

non
1 1 2 2 1 2 2 2 2 pneumonia

Pneumonia
1 1 2 2 3 2 2 2 2
non
3 2 2 2 1 1 2 2 2 pneumo
non
3 1 2 2 1 1 2 2 2 pneumo
non
1 2 2 2 1 2 1 2 1 pneumo
non
2 2 2 2 2 2 2 2 2 pneumo
Pneumonia
3 2 2 2 1 1 2 2 1
non
3 2 1 2 2 1 2 2 1 pneumo
non
1 1 2 2 1 1 2 2 2 pneumo
Pneumonia
3 2 2 2 2 2 2 2 1
6

Pneumonia
3 2 1 2 2 2 2 2 1
Pneumonia
2 2 2 2 3 2 1 2 2
non
2 2 2 2 1 1 2 2 2
pneumo
non
1 2 2 2 1 2 1 2 1
pneumo
Pneumonia
3 2 2 2 3 2 1 2 2
non
1 2 2 2 2 1 2 2 1
pneumo
non
3 2 1 2 1 1 2 2 2
pneumo
Pneumonia
1 1 2 2 2 2 1 2 2
Pneumonia
1 1 2 1 2 2 2 2 2
Pneumonia
2 2 2 2 3 2 1 2 1
Pneumonia
2 2 2 2 2 1 2 2 2
non
2 2 1 2 1 1 2 2 2 pneumonia

Pneumonia
2 2 2 1 2 2 2 2 2
non
3 2 1 2 1 1 2 2 2 pneumo
non
2 2 2 2 2 2 1 2 2
pneumo
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
3 2 2 1 2 2 2 2 1
Pneumonia
2 2 2 2 2 2 2 2 2
Pneumonia
3 2 2 2 3 2 2 2 2
Pneumonia
1 1 1 2 3 2 1 2 2
Pneumonia
2 1 1 2 2 2 1 2 2
Pneumonia
2 2 2 1 3 2 2 2 1
Pneumonia
3 2 2 2 2 2 2 2 2
Pneumonia
1 1 1 1 2 1 1 1 1
6

Perhitungan Jumlah Kasus Keseluruhan


Perhitungan nood 1 (root) untuk mencari entropy total :
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 160
Jumlah kasus (P/S1)= 122
Jumlah kasus (Np/S2)= 38
Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−122
Entropy (total) = ( × log 2( 122)) + ( −38 × log 2( 38 ))
160 160 160 160

Entropy (total) =
0.790858091
Menghitung nilai entropy pada masing-masing atribut kelas:
1. Menghitung nilai entropy atribut kelas umur:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
a. Atribut umur 1 tahun:
Jumlah kasus (S)= 56
Jumlah kasus (P/S1)= 39
Jumlah kasus (Np/S2)= 17
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −39 × log 2( 39)) + ( −17 × log 2(17))
56 56 56 56

Entropy = 0.885612871
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 57
Jumlah kasus (P/S1)= 45
Jumlah kasus (Np/S2)=12
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −45 × log 2( 45)) + ( −12 × log 2(12))
57 57 57 57

Entropy = 0.74248757
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 47
Jumlah kasus (P/S1)= 38
Jumlah kasus (Np/S2)= 9
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −38 × log 2( 38)) + ( −9 × log 2( 9 ))
47 47 47 47

Entropy = 0.704576713
6

2. Menghitung nilai entropy atribut kelas berat:


a. Atribut berat 1:
Jumlah kasus (S)= 58
Jumlah kasus (P/S1)= 43
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −43 × log 2( 43)) + ( −15 × log 2(15))
58 58 58 58

Entropy = 0.824657833
b. Atribut berat 2:
Jumlah kasus (S)= 91
Jumlah kasus (P/S1)= 69
Jumlah kasus (Np/S2)= 22
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−69
Entropy = ( × log 2( 69)) + ( −22 × log 2(22))
91 91 91 91

Entropy = 0.797951968
c. Atribut berat 3:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 10
Jumlah kasus (Np/S2)=1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−10
Entropy = ( × log 2( 10)) + ( −1 × log 2( 1 ))
11 11 11 11

Entropy = 0.439496987
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kaus (S)= 42
Jumlah kasus (P/S1)= 31
Jumlah kasus (Np/S2)= 11
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −31 × log 2( 31)) + ( −11 × log 2(11))
42 42 42 42

Entropy = 0.829607103
b. Atribut batuk 2:
Jumlah kasus (S)= 118
Jumlah kasus (P/S1)= 91
Jumlah kasus (Np/S2)= 27
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
6

Entropy = ( −91 × log 2( 91


)) + ( −27 × log 2( 27 ))
118 118 118 118

Entropy =
0.775937331
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kaus (S)= 29
Jumlah kasus (P/S1)= 23
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−23
Entropy = ( × log 2( 23)) + ( −6 × log 2( 6 ))
29 29 29 29

Entropy = 0.802077159
b. Atribut flue 2:
Jumlah kaus (S)= 131
Jumlah kasus (P/S1)= 99
Jumlah kasus (Np/S2)= 32
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−99
Entropy = ( × log 2( 99
)) + ( −32 × log 2( 32 ))
131 131 131 131

Entropy =
0.802077159
5. Menghitung nilai entropy atribut kelas demam:
a. Atribut demam 1:
Jumlah kasus (S)= 27
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 21
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −21 × log 2(21))
27 27 27 27

Entropy = 0.764204507
b. Atribut demam 2:
Jumlah kasus (S)= 85
Jumlah kasus (P/S1)= 68
Jumlah kasus (Np/S2)= 17
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−68
Entropy = ( × log 2( 68)) + ( −17 × log 2(17))
85 85 85 85

Entropy = 0.721928095
c. Atribut demam 3:
Jumlah kasus (Np/S2)=
6
Jumlah kasus (S)= 48
Jumlah kasus (P/S1)= 48

Jumlah kasus (Np/S2)=


6

Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−48
Entropy = ( × log 2( 48)) + ( −0 × log 2( 0 ))
48 48 48 48

Entropy = 0
6. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat 1:
Jumlah kasus (S)= 34
Jumlah kasus (P/S1)= 12
Jumlah kasus (Np/S2)= 22
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −12 × log 2( 12)) + ( −22 × log 2(22))
34 34 34 34

Entropy = 0.936667382
b. Atribut nafas berat 2:
Jumlah kasus (S)= 126
Jumlah kasus (P)= 110
Jumlah kasus (Np/S2)= 16
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −110 × log 2( 110)) + ( −16 × log 2( 16 ))
126 126 126 126

Entropy =
0.549108745
7. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 52
Jumlah kasus (P/S1)= 45
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−45
Entropy = ( × log 2( 45)) + ( −7 × log 2( 7 ))
52 52 52 52

Entropy = 0.569961376
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 108
Jumlah kasus (P/S1)= 77
Jumlah kasus (Np/S2)= 31
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−77
Entropy = ( × log 2( 77
)) + ( −31 × log 2( 31 ))
108 108 108 108

Entropy = 0.864862972
8. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (P/S1)=
6
Jumlah kasus (S)= 16

Jumlah kasus (P/S1)=


7

Jumlah kasus (Np/S2)= 3


Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −13 × log 2( 13)) + ( −3 × log 2( 3 ))
16 16 16 16

Entropy = 0.69621226
b. Atribut status gizi 2:
Jumlah kasus (S)= 144
Jumlah kasus (P/S1)= 109
Jumlah kasus (Np/S2)= 35
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −109 × log 2( 109)) + ( −35 × log 2( 35 ))
144 144 144 144

Entropy = 0.800084745
9. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 43
Jumlah kasus (P/S1)= 37
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−37
Entropy = ( × log 2( 37)) + ( −6 × log 2( 6 ))
43 43 43 43

Entropy = 0.583019417
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 117
Jumlah kasus (P/S1)= 85
Jumlah kasus (Np/S2)= 32
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −85 × log 2( 85
)) + ( −32 × log 2( 32 ))
117 117 117 117

Entropy = 0.846448228
Menghitung nilai gain pada masing-masing atribut kelas untuk menentukan akar
pohon:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛 umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
𝑖=0 total
Gain(total,umur) = 0.790858091 – (( 56 ×0.885612871) +
160
( 57 ×0.742487570) + ( 47 ×0.704576713)
160 160

Gain (total,umur) = 0.00941298


2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) –
∑𝑛 berat
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
𝑖=0 total
7

Gain(total,berat) = 0.790858091 – (( 58
160
×0.824657833) +
91
( ×0.797951968) + ( 11
×0.439496987)
160 160
Gain (total,berat) = 0.007869026
3. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛
𝑖=0 total
Gain(total,batuk) = 0.790858091 – (( 42 ×0.829607103) +
160
118
( ×0.775937331)
160
Gain (total,batuk) = 0.000832445
4. Menghitung nilai gain atribut kelas flue:
Gain (total,flue) = Entropy (total) – flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
∑𝑛
𝑖=0 total
Gain(total,flue) = 0.790858091 – (( 29 ×0.802077159) +
160
(131 ×0.802077159)
160
Gain (total,flue) = -0.011219068
5. Menghitung nilai gain atribut kelas demam:
Gain (total,demam) = Entropy (total) – ∑𝑛 demam
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(demam)
𝑖 total
Gain(total,demam) = 0.790858091 – (( 27 ×0.764204507) +
160
85
( ×0.721928095) + ( 48
×0)
160 160
Gain (total,demam) = 0.27837428
6. Menghitung nilai gain atribut kelas nafas berat:
Gain (total,nafas berat) =Entropy(total)– nafas berat
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.790858091 – (( 34 ×0.936667382) +
160
(126 ×0.549108745)
160
Gain (total,nafas berat) = 0.159393135
7. Menghitung nilai gain atribut kelas status tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy(total) – tenggorokan merah
∑𝑛 𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.790858091 – (( 52 ×0.569961376)
160
+ (108 ×0.864862972)
160
Gain (total,tenggorokan merah) = 0.021838137
8. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) =Entropy(total) – status gizi
∑𝑛
𝑖 total ×

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.790858091 – (( 16 ×0.69621226) +
160
(144 ×0.800084745)
160
Gain (total,status gizi) = 0.001160594
9. Menghitung nilai gain atribut kelas lingkungan rokok:
7

Gain(total,lingkungan rokok) = Entropy(total) – llingkungan rokok


𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(lingkungan rokok)
Gain(total,lingkungan rokok) = 0.790858091 – (( 43 ×0.583019417)
160
+ (117 ×0.846448228)
160
Gain (total,lingkungan rokok) = 0.015206356

Cari nood berikutnya dengan cara yang sama seperti pada perhitungan nood
pertama, cari nood berikutnya dengan memfilter data berdasarkan nilai atribut
demam.
Perhitungan nood (root) untuk mencari entropy demam 1:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 27
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 21
Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy (total) = ( −6 × log 2( 6 )) + ( −21 × log 2(21))
27 27 27 27

Entropy (total) = 0.764204507


Menghitung nilai entropy pada masing-masing atribut kelas:
1. Menghitung nilai entropy atribut kelas umur:
a. Atribut umur 1 tahun:
Jumlah kasus (S)= 7
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −7 × log 2(7))
7 7 7 7

Entropy = 0
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −6 × log 2(6))
6 6 6 6

Entropy = 0
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 6
7

Jumlah kasus (Np/S2)= 8


Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −6 × log 2( 6 )) + ( −8 × log 2( 8 ))
14 14 14 14

Entropy = 0.985228136
2. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −6 × log 2(6))
6 6 6 6

Entropy = 0
b. Atribut berat 2:
Jumlah kasus (S)= 19
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 14
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −14 × log 2(14))
19 19 19 19

Entropy = 0.831474388
c. Atribut berat 3:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2

Entropy = 1
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −6 × log 2( 6 ))
10 10 10 10

Entropy = 0.970950594
b. Atribut batuk 2:
Jumlah kasus (S)= 17
7

Jumlah kasus (P/S1)= 2


Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2 )) + ( −15 × log 2(15))
17 17 17 17

Entropy = 0.522559375
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 3
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −2 × log 2(2))
3 3 3 3

Entropy = 0.738284866
b. Atribut flue 2:
Jumlah kasus (S)= 24
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 19
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −19 × log 2(19))
24 24 24 24

Entropy = 0.738284866
5. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat 1:
Jumlah kasus (S)= 18
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 14
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −14 × log 2(14))
18 18 18 18

Entropy = 0.764204507
b. Atribut nafas berat 2:
Jumlah kasus (S)= 9
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −7 × log 2(1))
9 9 9 2

Entropy = 0.764204507
6. Menghitung nilai entropy atribut kelas tenggorokan merah:
7

a. Atribut tenggorokan merah 1:


Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 5
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −5 × log 2(5))
6 6 6 6

Entropy = 0.650022422
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 21
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 16
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −16 × log 2(16))
21 21 21 21

Entropy = 0.791858353
7. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
b. Atribut status gizi 2:
Jumlah kasus (S)= 26
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 20
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −20 × log 2(20))
26 26 26 26

Entropy = 0.779349837
8. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( −2 × log 2(2))
6 6 6 6

Entropy = 0.918295834
7

b. Atribut lingkungan rokok 2:


Jumlah kasus (S)= 21
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 17
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −17 × log 2(17))
21 21 21 21

Entropy = 0.702466551
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛 umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
𝑖=0 total
Gain(total,umur) = 0.764204507 – (( 7 ×0) + ( 6 × 0) +
27 27
(14 ×0.985228136)
27
Gain (total,umur) = 0.253345473
2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – ∑𝑛𝑖=0berat × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
total
6
Gain(total,berat) = 0.764204507 – (( ×0) + (19 ×0.831474388) +
27 27
( ×1)
2
27
Gain (total,berat) = 0.105018826
3. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛
𝑖=0 total
Gain(total,batuk) = 0.764204507 – ((10 ×0.970950594)
27
+ (17 ×0.522559375)
27
Gain (total,batuk) = 0.07557431
4. Menghitung nilai gain atribut kelas flue:
Gain (total,flue) = Entropy (total) – flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
∑𝑛
Gain(total,flue) = 0.764204507 – (( 3 𝑖=0 total
27
×0.738284866) + (24 ×0.738284866)
27
Gain (total,flue) = 0.02591964
5. Menghitung nilai gain atribut kelas nafas berat:
Gain(total,nafas berat) = Entropy (total) – nafas berat
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.764204507 – ((18 ×0.764204507)
27
+ ( 9 × 0.764204507)
27
Gain (total,nafas berat) =0
6. Menghitung nilai gain atribut kelas tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy (total) – ∑𝑛 tenggorokan merah
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
7

Gain(total,tenggorokan merah) = 0.764204507 – (( 6 ×0.650022422) +


27
(( ×0.791858353)
21
27
Gain (total,tenggorokan merah) = 0.00386525
7. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) = Entropy (total) – status gizi
∑𝑛
𝑖 total ×

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.764204507 – (( 1 ×0) +
27
((26 ×0.779349837)
27
Gain (total,status gizi) = 0.013719478
8. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.764204507 – (( 6 ×0.918295834) +
27
21
(( ×0.702466551)
27
Gain (total,tenggorokan merah) = 0.013775892
Perhitungan nood (root) untuk mencari entropy umur 3:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 8
Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy (total) = ( × log 2( 6 )) + ( −8 × log 2( 8 ))
14 14 14 14

Entropy (total) = 0.985228136


Menghitung nilai entropy pada masing-masing atribut kelas:
1. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
b. Atribut berat 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 6
7

Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −6 × log 2( 6 ))
11 11 11 11

Entropy = 0.994030211
c. Atribut berat 3:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2

Entropy = 1
2. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( −2 × log 2(2))
6 6 6 6

Entropy = 0.918295834
b. Atribut batuk 2:
Jumlah kasus (S)= 8
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −6 × log 2(6))
8 8 8 8

Entropy = 0.811278124
3. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2

Entropy = 0.979868757
b. Atribut flue 2:
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 5
7

Jumlah kasus (Np/S2)= 7


Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −5 × log 2( 5 )) + ( −7 × log 2( 7 ))
12 12 12 12

Entropy = 0.979868757
4. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat1:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −6 × log 2( 6 ))
10 10 10 10

Entropy = 0.970950594
b. Atribut nafas berat 2:
Jumlah kasus (S)= 4
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −2 × log 2(2))
4 4 4 4

Entropy = 1
5. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2

Entropy = 1
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −7 × log 2( 7 ))
12 12 12 12

Entropy = 0.979868757
6. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
8

Jumlah kasus (S)= 1


Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
b. Atribut status gizi 2:
Jumlah kasus (S)= 13
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −6 × log 2( 6 )) + ( −7 × log 2( 7 ))
13 13 13 13

Entropy = 0.995727452
7. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −0 × log 2(0))
2 2 2 2

Entropy = 0
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 8
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −8 × log 2( 8 ))
12 12 12 12

Entropy = 0.918295834
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – ∑𝑛𝑖=0berat × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
total
1
Gain(total,berat) = 0.985228136 – (( ×0) + (11 ×0.994030211) +
14 14
( 2 ×1)
14
Gain (total,berat) = 0.061347256
2. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛
𝑖=0 total
8

Gain(total,batuk) = 0.985228136 – (( 6 ×0.918295834) +


14
( 8 ×0.811278124)
14
Gain (total,batuk) = 0.128085279
3. Menghitung nilai gain atribut kelas
flue: flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
Gain (total,flue) = Entropy (total) – ∑𝑛
𝑖=0 total
Gain(total,flue) = 0.985228136 – (( 2 ×0.979868757) + (12 ×
14 14
0.979868757)
Gain (total,flue) = 0.005359379
4. Menghitung nilai gain atribut kelas nafas berat:
Gain (total,nafas berat) = Entropy (total) – nafas berat
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.985228136 – ((10
14
×0.970950594)
+ ( 4 ×1)
14
Gain (total,nafas berat) = 0.005977711
5. Menghitung nilai gain atribut kelas tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy (total) – ∑𝑛 tenggorokan mrah
total ×
𝑖
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.985228136 – (( 2 ×1) + (12 ×
14 14
0.979868757)
Gain (total,tenggorokan merah) = 0.002483487
6. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) = Entropy (total) – status gizi
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.985228136 – (( 1 ×0) +
14
((13 ×0.995727452)
14
Gain (total,status gizi) = 0.060624073
7. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,lingkungan rokok) = Entropy (total) – lingkungan rokok
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(lingkungan rokok)
Gain(total,lingkungan rokok) = 0.985228136 – (( 2 ×0) +
14
((12 ×0.918295834)
14
Gain (total,lingkungan rokok) = 0.198117421
Perhitungan nood (root) untuk mencari entropy lingkungan rokok 2:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 8
8

Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖


𝑖
−4
Entropy (total) = ( × log 2( 4 )) + ( −8 × log 2( 8 ))
12 12 12 12

Entropy (total) = 0.918295834


Menghitung nilai entropy pada masing-masing atribut kelas:
1. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
b. Atribut berat 2:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −6 × log 2( 6 ))
10 10 10 10

Entropy = 0.970950594
c. Atribut berat 3:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
2. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 5
Jumlah kasus (P/S1)= 3
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−3
Entropy = ( × log 2( 3)) + ( −2 × log 2(2))
5 5 5 5

Entropy = 0.970950594
b. Atribut batuk 2:
8

Jumlah kasus (S)= 7


Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −6 × log 2(6))
7 7 7 7

Entropy = 0.591672779
3. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0.945660305
b. Atribut flue 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −7 × log 2( 7 ))
11 11 11 11

Entropy = 0.945660305
4. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat1:
Jumlah kasus (S)= 9
Jumlah kasus (P/S1)= 3
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−3
Entropy = ( × log 2( 3)) + ( −6 × log 2(6))
9 9 9 9

Entropy = 0.918295834
b. Atribut nafas berat 2:
Jumlah kasus (S)= 3
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −2 × log 2(2))
3 3 3 3

Entropy = 0.918295834
8

5. Menghitung nilai entropy atribut kelas tenggorokan merah:


a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −7 × log 2( 7 ))
11 11 11 11

Entropy = 0.945660305
6. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1

Entropy = 0
b. Atribut status gizi 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −7 × log 2( 7 ))
11 11 11 11

Entropy = 0.945660305
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – ∑𝑛𝑖=0berat × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
total
1
Gain(total,berat) = 0.918295834 – (( ×0) + (10 ×0.970950594) +
12 12
( ×0)
1
12
Gain (total,berat) = 0.109170339
2. Menghitung nilai gain atribut kelas batuk:
8

Gain (total,batuk) = Entropy (total) – ∑𝑛 batuk × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)


𝑖=0 total
Gain(total,batuk) = 0.918295834 – (( 5 ×0.970950594) +
12
7
( ×0.591672779)
12
Gain (total,batuk) = 0.168590632
3. Menghitung nilai gain atribut kelas
flue: flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
Gain (total,flue) = Entropy (total) – ∑𝑛
𝑖=0 total
Gain(total,flue) = 0.918295834 – (( 1 ×0.945660305) + (11 ×
12 12
0.945660305)
Gain (total,flue) = -0.027364471
4. Menghitung nilai gain atribut kelas nafas berat:
Gain (total,nafas berat) = Entropy (total) – nafas berat
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.918295834 – (( 9 ×0.918295834)
12
+ ( 3 × 0.918295834)
12
Gain (total,nafas berat) =0
5. Menghitung nilai gain atribut kelas tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy (total) – ∑𝑛 tenggorokan mrah
total ×
𝑖
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.918295834 – (( 1 ×0) + (11 ×
12 12
0.945660305)
Gain (total,tenggorokan merah) = 0.051440555
6. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) = Entropy (total) – status gizi
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.918295834 – (( 1 ×0) +
12
((11 ×0.945660305)
12
Gain (total,status gizi) = 0.051440555
Perhitungan nood (root) untuk mencari entropy demam 2:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 85
Jumlah kasus (P/S1)= 68
Jumlah kasus (Np/S2)= 17
Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−68
Entropy (total) = ( × log 2( 68)) + ( −17 × log 2(17))
85 85 85 85

Entropy (total) = 0.721928095


Menghitung nilai entropy pada masing-masing atribut kelas:
8

1. Menghitung nilai entropy atribut kelas umur:


a. Atribut umur 1 tahun:
Jumlah kasus (S)= 28
Jumlah kasus (P/S1)= 18
Jumlah kasus (Np/S2)= 10
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −18 × log 2( 18)) + ( −10 × log 2(10))
28 28 28 28

Entropy = 0.940285959
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 33
Jumlah kasus (P/S1)= 27
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−27
Entropy = ( × log 2( 27)) + ( −6 × log 2( 6 ))
33 33 33 33

Entropy = 0.684038436
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 24
Jumlah kasus (P/S1)= 23
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−23
Entropy = ( × log 2( 23)) + ( −1 × log 2( 1 ))
24 24 24 24

Entropy = 0.249882293
2. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 30
Jumlah kasus (P/S1)= 21
Jumlah kasus (Np/S2)= 9
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −21 × log 2( 21)) + ( −9 × log 2( 9 ))
30 30 30 30

Entropy = 0.881290899
b. Atribut berat 2:
Jumlah kasus (S)= 48
Jumlah kasus (P/S1)=
40 Jumlah kasus
Entropy = ∑𝑛
𝑖 − 𝑝𝑖 ∗ log2∗

Entropy = ( −40 × log 2( 40)) + ( −84 × log 2( 84


4 4
8

Entropy = 0.650022422
c. Atribut berat 3:
Jumlah kasus (S)= 7
Jumlah kasus (P/S1)= 7
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −7 × log 2( 7)) + ( −0 × log 2(0))
7 7 7 7

Entropy = 0
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 21
Jumlah kasus (P/S1)= 16
Jumlah kasus (Np/S2)= 5
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −16 × log 2( 16)) + ( −5 × log 2( 5 ))
21 21 21 21

Entropy = 0.791858353
b. Atribut batuk 2:
Jumlah kasus (S)= 64
Jumlah kasus (P/S1)= 52
Jumlah kasus (Np/S2)= 12
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −52 × log 2( 52)) + ( −12 × log 2(12))
64 64 64 64

Entropy = 0.69621226
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 15
Jumlah kasus (P/S1)= 11
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−11
Entropy = ( × log 2( 11)) + ( −4 × log 2( 4 ))
15 15 15 15

Entropy = 0.692419486
b. Atribut flue 2:
Jumlah kasus (S)= 70
Jumlah kasus (P/S1)=
57 Jumlah kasus
Entropy = ∑𝑛
𝑖 − 𝑝𝑖 ∗ log2∗

Entropy = ( −57
7
× log 2( 57
7
)) + ( −13
7
× log 7
8

Entropy = 0.692419486
5. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat 1:
Jumlah kasus (S)= 16
Jumlah kasus (P/S1)= 8
Jumlah kasus (Np/S2)= 8
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −8 × log 2( 8 )) + ( −8 × log 2( 8 ))
16 16 16 16

Entropy = 1
b. Atribut nafas berat 2:
Jumlah kasus (S)= 69
Jumlah kasus (P/S1)= 60
Jumlah kasus (Np/S2)= 9
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −60 × log 2( 60)) + ( −9 × log 2( 9 ))
69 69 69 69

Entropy = 0.558629373
6. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 23
Jumlah kasus (P/S1)= 21
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−21
Entropy = ( × log 2( 21)) + ( −2 × log 2( 2 ))
23 23 23 23

Entropy = 0.426228657
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 62
Jumlah kasus (P/S1)= 47
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−47
Entropy = ( × log 2( 47)) + ( −15 × log 2(15))
62 62 62 62

Entropy = 0.798244134
7. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 8
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
8

Entropy = ( −8 × log 2( 8 )) + ( −2 × log 2( 2 ))


10 10 10 10

Entropy = 0.721928095
c. Atribut status gizi 2:
Jumlah kasus (S)= 75
Jumlah kasus (P/S1)= 60
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −60 × log 2( 60)) + ( −15 × log 2(15))
75 75 75 75

Entropy = 0.721928095
8. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 18
Jumlah kasus (P/S1)= 16
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −16 × log 2( 16)) + ( −2 × log 2( 2 ))
18 18 18 18

Entropy = 0.503258335
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 67
Jumlah kasus (P/S1)= 52
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −52 × log 2( 52)) + ( −15 × log 2(15))
67 67 67 67

Entropy = 0.767190321
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛 umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
𝑖=0 total
Gain(total,umur) = 0.721928095 – ((28 ×0.940285959) +
85
( ×0.684038436) + ( ×0.249882293)
33 24
85 85
Gain (total,umur) = 0.076063974
2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – berat
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
∑𝑛
𝑖=0 total
Gain(total,berat) = 0.721928095 – ((30 ×0.881290899) +
85
(48 ×0.650022422) + ( 7 ×0)
85 85
Gain (total,berat) = 0.043812763
3. Menghitung nilai gain atribut kelas batuk:
9

Gain (total,batuk) = Entropy (total) – ∑𝑛 batuk × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)


𝑖=0 total
Gain(total,batuk) = 0.721928095 – ((21 ×0.791858353)
85
64
+ ( ×0.69621226)
85
Gain (total,batuk) = 0.002085624
4. Menghitung nilai gain atribut kelas flue:
Gain (total,flue) = Entropy (total) – flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
∑𝑛
𝑖=0 total
Gain(total,flue) = 0.721928095 – ((15 ×0.692419486) + (70 ×0.692419486)
85 85
Gain (total,flue) = 0.029508609
5. Menghitung nilai gain atribut kelas nafas berat:
Gain(total,nafas berat) = Entropy (total) – nafas berat
∑𝑛 𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.721928095 – ((16 ×1) + (69 ×
85 85
0.558629373)
Gain (total,nafas berat) = 0.080217192
6. Menghitung nilai gain atribut kelas tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
∑𝑛 𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.721928095 – ((23 ×0.426228657) +
85
(( ×0.798244134)
62
85
Gain (total,tenggorokan merah) = 0.024346973
7. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) = Entropy (total) – status gizi
∑𝑛
𝑖 total ×

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.721928095 – ((10 ×0.721928095) +
85
((75 ×0.721928095)
85
Gain (total,status gizi) =0
8. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.721928095 – ((18 ×0.503258335) +
85
(( ×0.767190321)
67
85
Gain (total,tenggorokan merah) = 0.010629254
Perhitungan nood (root) untuk mencari entropy nafas berat 1:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 15
Jumlah kasus (P/S1)= 8
Jumlah kasus (Np/S2)= 7
9

Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖


𝑖
−8
Entropy (total) = ( × log 2( 8 )) + ( −7 × log 2( 7 ))
15 15 15 15

Entropy (total) = 0.996791632


Menghitung nilai entropy pada masing-masing atribut kelas:
1. Menghitung nilai entropy atribut kelas umur:
a. Atribut umur 1 tahun:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −4 × log 2(4))
6 6 6 6

Entropy = 0.918295834
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( 2 × log 2(2))
6 6 6 6

Entropy = 0.918295834
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 3
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −1 × log 2(1))
3 3 3 3

Entropy = 0.918295834
2. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −4 × log 2(4))
6 6 6 6

Entropy = 0.918295834
b. Atribut berat 2:
9

Jumlah kasus (S)= 7


Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 3
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( −3 × log 2(3))
7 7 7 7

Entropy = 0.985228136
c. Atribut berat 3:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −0 × log 2(0))
2 2 2 2

Entropy = 0
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 5
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 3
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −3 × log 2(3))
5 5 5 5

Entropy = 0.970950594
b. Atribut batuk 2:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −6 × log 2( 6 )) + ( −4 × log 2( 4 ))
10 10 10 10

Entropy = 0.970950594
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −0 × log 2(0))
1 1 1 1

Entropy =
9

b. Atribut flue 2:
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 7
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−7
Entropy = ( × log 2( 7 )) + ( −7 × log 2( 7 ))
14 14 14 14

Entropy = 1
5. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −0 × log 2(0))
2 2 2 2

Entropy = 0
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 13
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −7 × log 2( 7 ))
13 13 13 13

Entropy = 0.995727452
6. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −0 × log 2(0))
1 1 1 1

Entropy = 0
d. Atribut status gizi 2:
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 7
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−7
Entropy = ( × log 2( 7 )) + ( −7 × log 2( 7 ))
1 1 1 1

Entropy =
9

7. Menghitung nilai entropy atribut kelas lingkungan rokok:


a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 4
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −2 × log 2(2))
4 4 4 4

Entropy = 1
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 5
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −5 × log 2( 5 ))
11 11 11 11

Entropy = 0.994030211
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛𝑖=0umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
total
Gain(total,umur) = 0.996791632 – (( 6 ×0.918295834) + ( 6 ×
15 15
0.918295834) + ( 3 × 0.918295834)
15
Gain (total,umur) = 0.0784958
2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – berat
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
∑𝑛
𝑖=0 total
Gain(total,berat) = 0.996791632 – (( 6 ×0.918295834) +
15
( ×0.985228136) + ( ×0)
7 2
15 15
Gain (total,berat) = 0.16970017
3. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛 𝑖=0 total

Gain(total,batuk) = 0.996791632 – (( 5 ×0.970950594) + (10 ×


15 15
0.970950594)
Gain (total,batuk) = 0.02584104
4. Menghitung nilai gain atribut kelas flue:
Gain (total,flue) = Entropy (total) – flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
∑𝑛
Gain(total,flue) = 0.996791632 – (( 1 𝑖=0 total
15
×1) + (14 ×1)
15
Gain (total,flue) = -0.0032084
5. Menghitung nilai gain atribut kelas tenggorokan merah:
9

Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah


𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.996791632 – (( 2 ×0) +
15
(( ×0.995727452)
13
15
Gain (total,tenggorokan merah) = 0.13382784
6. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) = Entropy (total) – status gizi
∑𝑛
𝑖 total ×

𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.996791632 – (( 1 ×0) + ((14 ×1)
15 15
Gain (total,status gizi) = 0.0634583
7. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.996791632 – (( 4 ×1) +
15
(( ×0.994030211
11
15
Gain (total,tenggorokan merah) = 0.00116948

Lakukan proses perhitungan yang sama seperti pada perhitungan node


sebelumnya hingga cabang akar pohon terakhir. Hasil cabang pohon terakhir yaitu
batuk dengan hasil nilai gain 0.46956521 pada cabang pohon penyakit ISPA.

Anda mungkin juga menyukai