ii
iii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Allah SWT, karena atas segala
nikmat dan karunianya yang telah memberikan kesempatan, kesehatan dan
kemudahan kepada penulis sehingga akhirnya dapat menyelesaikan Skripsi ini
dengan baik. Tersusunlah Skripsi yang berjudul “PERANCANGAN DATA
MINING UNTUK KLASIFIKASI DALAM PREDIKSI PENYAKIT ISPA
PADA BALITA DENGAN ALGORITMA C4.5”.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan
ucapan terima kasih yang sebesar-besarnya kepada:
1. Bapak Dr.Ir. Supriyanto, M.P. selaku Ketua STT Pelita Bangsa Cikarang.
2. Bapak Aswan Supriyadi Sunge, S.E, M.Kom selaku Ketua Program Studi
Teknik Informatika STT Pelita Bangsa.
3. Bapak Donny Maulana, S.Kom, M.MSi selaku pembimbing utama yang
telah banyak memberikan arahan dan bimbingan yang sangat berarti kepada
penulis, dalam penyusunan Skripsi ini dengan sebaik-baiknya.
4. Bapak Agus Suwarno, S.Kom, M.T. selaku pembimbing kedua yang telah
banyak memberikan arahan dan bimbingan yang sangat berarti kepada
penulis, dalam penyusunan Skripsi ini dengan sebaik-baiknya.
5. Seluruh Dosen Sekolah Tinggi Teknologi Pelita Bangsa yang telah membekali
penulis dengan wawasan dan ilmu di bidang teknik informatika.
iv
v
DAFTAR ISI
PERSETUJUAN.......................................................................................................i
PENGESAHAN.......................................................................................................ii
PERNYATAAN KEASLIAN PENELITIAN........................................................iii
KATA PENGANTAR............................................................................................iv
DAFTAR ISI...........................................................................................................vi
DAFTAR TABEL.................................................................................................viii
DAFTAR GAMBAR..............................................................................................ix
DAFTAR LAMPIRAN............................................................................................x
ABSTRAK..............................................................................................................xi
ABSTRACT.............................................................................................................xii
BAB I PENDAHULUAN........................................................................................1
1.1 Latar Belakang Masalah...............................................................................1
1.2 Identifikasi Masalah.....................................................................................4
1.3 Batasan Masalah...........................................................................................5
1.4 Rumusan Masalah........................................................................................5
1.5 Tujuan Penelitian.........................................................................................5
1.6 Manfaat Penelitian.......................................................................................5
1.6.1 Manfaat Bagi Penulis........................................................................5
1.6.2 Manfaat Bagi Masyarakat.................................................................6
1.6.3 Manfaat Bagi Program Studi Teknik Informatika............................6
1.6.4 Manfaat Bagi Tenaga Medis Kesehatan...........................................6
1.7 Sistematika Penulisan...................................................................................6
BAB II TINJAUAN PUSTAKA..............................................................................8
2.1 Penelitian Terdahulu....................................................................................8
2.2 Tinjauan Teori..............................................................................................9
2.2.1 Pengertian Data Mining...................................................................9
2.2.2 Pengertian Klasifikasi....................................................................10
2.2.3 Pengertian Pohon Keputusan (Decision Tree)...............................11
2.2.4 Kelebihan Decision Tree................................................................12
2.2.5 Kekurangan Decision Tree.............................................................12
2.2.6 Pengertian Algoritma C4.5.............................................................13
2.2.7 Kelebihan C4.5...............................................................................16
2.2.8 Kekurangan C4.5............................................................................16
2.2.9 Pengertian ISPA.............................................................................16
2.2.10 Pengertian ISPA Non Pneumonia(ISPA Ringan)........................17
vi
2.2.11 Pengertian ISPA Pneumonia(ISPA Sedang/Berat)......................18
2.2.12 Penyebab Terjadinya ISPA..........................................................19
2.3 Kerangka Pemikiran...................................................................................21
BAB III METODE PENELITIAN.........................................................................23
3.1 Objek Penelitian.........................................................................................23
3.1.1 Profile Puskesmas Mekarmukti......................................................23
3.1.2 Visi Misi Perusahaan......................................................................24
3.2 Peralatan Yang Digunakan.........................................................................24
3.3 Tahapan Penelitian.....................................................................................25
3.4 Tahapan Analisa Data................................................................................27
3.5 Metode Yang Diusulkan............................................................................28
3.6 Pengumpulan Data.....................................................................................28
3.6.1 Pengelolaan Data Awal.................................................................30
BAB IV HASIL DAN PEMBAHASAN...............................................................39
4.1 Hasil Penelitian..........................................................................................39
4.1.1 Evaluasi dan Validasi hasil Algoritma C4.5..................................39
4.1.2 Perhitungan Algoritma C4.5..........................................................39
4.1.3 Pengelolaan Dataset.......................................................................43
4.1.4 Menghitung Entropy Split Dataset.................................................52
4.2 Pembahasan................................................................................................52
BAB V KESIMPULAN DAN SARAN.................................................................54
5.1 Kesimpulan................................................................................................54
5.2 Saran...........................................................................................................54
DAFTAR PUSTAKA............................................................................................55
LAMPIRAN...........................................................................................................58
vii
DAFTAR
v
DAFTAR
i
DAFTAR
x
ABSTRA
Infeksi saluran pernafasan akut (ISPA) adalah penyakit infeksi akut yang
menyerang salah satu bagian dan atau lebih dari saluran nafas mulai dari hidung
(saluran atas) hingga alveoli (saluran bawah) termasuk jaringan adneksanya,
seperti sinus, rongga telinga tengah dan pleura. ISPA dapat dibedakan menjadi
dua macam, terdapat ISPA non pneumonia yang dikenal oleh masyarakat dengan
istilah batuk pilek sedangkan ISPA pneumonia terjadi apabila batuk pilek
disertai dengan gejala lain, kesukaran bernapas, peningkatan frekuensi napas
(napas cepat). Perlu adanya pengklasifikasian jenis penyakit ISPA non
pneumonia ataupun pneumonia untuk mengetahui akurasinya. Pengujian yang
dilakukan terhadap 160 data menggunakan confusion matrix dan ROC curve
menghasilkan tingkat keakuratan sebesar 0.790% dengan +/-0.153% serta mikro
0.790%. Jika melihat dengan kurva ROC menggunakan dataset dengan akurasi
fair classification sebesar 0.790. Nilai keakuratan tersebut dapat dikatakan
cukup untuk digunakan dalam memprediksi jenis penyakit ISPA.
x
ABSTRACT
x
BAB I
PENDAHULUAN
1
2
ISPA dapat dibedakan menjadi dua macam, terdapat ISPA non pneumonia
yang dikenal oleh masyarakat dengan istilah batuk pilek sedangkan ISPA
pneumonia terjadi apabila batuk pilek disertai dengan gejala lain, kesukaran
bernapas, peningkatan frekuensi napas (napas cepat). Infeksi Saluran Pernapasan
Akut (ISPA) mencakup tiga unsur utama, yaitu infeksi, saluran pernapasan, dan
keakutan. Infeksi adalah invasi kuman atau mikroorganisme ke dalam tubuh
manusia dimana mereka mereproduksi dirinya sendiri, dengan demikian
menyebabkan gejala penyakit. Saluran pernapasan adalah seperangkat organ
tubuh, yang dimulai dari hidung ke alveoli bersama dengan organ adneksa.
Sementara itu, infeksi akut adalah infeksi yang berlangsung selama 14 hari atau
lebih. Berdasarkan pedoman pemberantasan penyakit ISPA untuk
penanggulangan pneumonia pada anak balita (Depkes, 2004), bahwa kriteria
untuk menanggulangi pola tatalaksana penyakit ISPA adalah anak balita dengan
gejala batuk atau kesulitan bernafas. Penyakit ISPA sangat berpengaruh besar
pada tingkat morbiditas dan mortalitas, karena salah satu penyakit infeksi
menular di dunia.
Menurut data dari WHO, sekitar empat juta orang meninggal karena ISPA
setiap tahun, 98% disebabkan oleh infeksi saluran pernapasan akut. 1,4 juta di
Indonesia dimana berdasarkan hasil Riset Kesehatan Dasar (Riskesdas) tahun
2013 didapatkan data bahwa prevalensi nasional ISPA di Indonesia adalah
25,0%, tidak jauh berbeda dengan tahun 2007 yaitu 25,5% . Anak di bawah lima
tahun adalah kelompok yang memiliki sistem kekebalan tubuh yang masih
rentan terhadap berbagai penyakit (Danusantoso, 2012). Kematian akibat
penyakit ISPA pada balita mencapai 12,4 juta pada balita golongan umur 0-1
tahun dan sebannyak 80,3% kematian ini terjadi di negara berkembang
(Kemenkes, 2010). Infeksi saluran pernapasan akut (ISPA) merupakan penyakit
yang sering terjadi pada anak. Infeksi Saluran Pernapasan Akut (ISPA)
merupakan salah satu masalah kesehatan yang ada di negara berkembang dan
negara maju. Hal ini disebabkan karena masih tingginya angka kesakitan dan
angka kematian karena ISPA khususnya pneumonia, terutama pada bayi dan
balita. Dimana ISPA
3
memberikan obat batuk. Jika dalam waktu tiga hari pasien masih menderita
ISPA, biasanya mereka akan kembali lagi ke Puskesmas untuk diberikan surat
rujukan untuk dirawat ke rumah sakit.
BAB I PENDAHULUAN
Pada bab ini berisi tentang latar belakang masalah, identifikasi masalah,
batasan masalah, rumusan masalah, tujuan penelitian, manfaat penelitian, dan
sistematika penulisan penelitian.
BAB V PENUTUP
Pada bab ini terdiri dari kesimpulan yang berisi tentang hal-hal terpenting
yang dibahas, bab ini juga berisi saran yang diberikan dan mungkin dapat
menambah pengetahuan untuk pengembangan perangkat lunak yang telah
dibuat.
BAB II
TINJAUAN PUSTAKA
8
9
Pada bab ini menjelaskan teori yang digunakan untuk mendukung penelitian
yang dilakukan. Pengertian serta teori yang dijabarkan yaitu mengenai
mengklasifikasi penyakit ISPA non pneumonia atau pneumonia, pengertian data
mining, pengertian klasifikasi, pengertian pohon keputusan (decision tree),
kelebihan decision tree, kekurangan decision tree, pengertian algoritma C4.5,
kelebihan algoritma C4.5, kekurangan algoritma C4.5, pengertian ISPA, non
pneumonia, pengertian ISPA pneumonia, penyebab terjadinya ISPA.
Tujuan dari teknik data mining adalah berusaha mencari manfaat dari
sekumpulan data tersebut. Dilihat dari disiplin ilmu yang digunakan, data mining
merupakan sebuah ilmu multi disiplin yang menyangkut berbagai disiplin ilmu
seperti database, kecerdasan buatan (artificial intelligence), information science
(ilmu informasi), high performance computing, visualisasi, machine learning,
statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika,
information retrieval dan information extraction serta pengenalan pada sebuah
1
pola. Saat ini data mining juga berkembang menjadi salah satu dari berbagai
konsep disiplin ilmu lain, seperti web mining dan text mining (Dini, 2014).
Metode ini digunakan untuk memprediksi nilai diskrit dari fungsi target,
yang mana fungsi pembelajaran dipresentasikan oleh sebuah decision tree
(G.Liang, 2005). Decision tree merupakan himpunan IF…THEN. Setiap path
dalam tree dihubungkan sebuah aturan, dimana presi terdiri dari sekumpulan
node-node yang ditemui, dan kesimpulan dari aturan terdiri atas kelas yang
terhubung dengan leaf dari path.
Terdapat 3 jenis node yang terdapat pada decision tree (Joko Lianto, Umi
Hanik, and Ahmad Saikhu, 2011), yaitu:
a. Root node, merupakan node paling atas, pada node ini tidak ada input
dan bisa tidak mempunyai output atau mempunyai output lebih dari satu.
b. Internal Node, merupakan node percabangan. Pada node ini terdapat
percabangan. Pada node ini terdapat satu input dan memiliki output
mininmal dua.
c. Leaf node atau terminal node, merupakan node akhir. Pada node ini
terdapat satu input dan tidak mempunyai output (Kusrini, Emma Taufiq
Luthfi, 2009).
Algoritma C4.5 adalah salah satu metode untuk membuat decision tree
berdasarkan training data yang telah disediakan. Algoritma C4.5 merupakan
pengembangan dari ID3. Beberapa pengembangan yang dilakukan pada C4.5
adalah sebagai antara lain bisa mengatasi missing value, bisa mengatasi continiu
data, dan pruning. Pohon keputusan mirip sebuah struktur pohon dimana
terdapat node internal (bukan daun) yang mendeskripsikan atribut-atribut, setiap
cabang menggambarkan hasil dari atribut yang diuji, dan setiap daun
menggambarkan kelas. Pohon keputusan bekerja mulai dari akar paling atas, jika
diberikan sejumlah data uji, misalnya X dimana kelas dari data X belum
diketahui, maka pohon keputusan akan menelusuri mulai dari akar sampai node
dan setiap nilai dari atribut sesuai data X diuji apakah sesuai dengan aturan
pohon keputusan, kemudian pohon keputusan akan memprediksi kelas dari tupel
X. Pada tahap algoritma C4.5 memiliki 2 prinsip kerja yaitu:
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada. Untuk suatu atribut yang populer, dapat dihitung
dengan cara pengelompokan berdasarkan masing-masing atribut dalam suatu data.
Notasi information gain adalah Gain (S,A) yang berarti dalam data atribut A relatif
terhadap output S. Digunakan rumus seperti tertera dalam persamaan 1 berikut:
Rumus : Gen(S,A) = Entropy(S) – ∑𝑛 |𝑠𝑖| * Entropy(Si)....(2.1)
𝑖=1 |𝑠|
Keterangan:
S : himpunan kasus
A : atribut
n : jumlah partisi atribut A
|Si| : jumlah kasus pada partisi ke-i
|S| : jumlah kasus dalam S
Sementara itu, penghitungan nilai entropy dapat dilihat pada persamaan 2
berikut :
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖.......(2.2)
𝑖
Keterangan:
1
S : himpunan kasus
A : fitur
n : jumlah partisi S
pi : proporsi dari S_i terhadap S
Sementara itu, Gain Ratio, yaitu nilai yang dipilih untuk menjadi root
node atau akar pohon, dapat dilihat pada persamaan 4 berikut:
𝐺𝑎𝑖𝑛 (S,A)
Rumus: Gain Ratio(S,A) = (2.4)
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (S,A)........
Keterangan :
S = Himpunan dataset kasus atau ruang sample
N = Banyaknya patisi S
A = Atribut
Pi = Probabilitas dari atribut kelas dibagi jumlah total kasus (i)
Si = Jumlah kasus pada atribut A yang memiliki partisi (i)
2. Jika terdapat nilai atribut yang hilang maka dapat di ubah menjadi tanda
“?”, nilai tersebut tidak akan digunakan dalam perhitungan gain dan
entropy.
3. Dapat dilakukan pemangkasan terhadap cabang pohon yang tidak
membantu dan menggantinya dengan leaf node.
Pneumonia dibagi atas derajat beratnya penyakit yaitu pneumonia berat dan
pneumonia tidak berat. Penyakit batuk pilek seperti rinitis, pharingitis, tonsilitis
dan penyakit jalan napas bagian atas lainnya digolongkan sebagai bukan
pneumonia. Pharingitis oleh kuman Streptococcus jarang ditemukan pada
balita(Depkes,2008).
Kelompok usia < 2 bulan apabila tidak ditemukan nafas cepat dan tarikan
dinding dada bagian bawah ke dalam. Kelompok usia dua bulan sampai kurang
dari 5 tahun apabila dalam pemeriksaan frekuensi nafas sesuai dengan golongan
usia yakni, kurang dari 50x per menit untuk golongan usia dua bulan hingga 12
bulan, kurang dari 40x per menit untuk golongan usia 12 bulan hingga 5 tahun
(Depkes RI, 2007).
ISPA sedang/ berat adalah suatu tanda dan gejala akut akibat infeksi yang
terjadi pada setiap bagian saluran pernafasan baik atas maupun bawah yang
disebabkan oleh jasad remik atau bakteri, virus maupun riketsin tanpa atau
disertai dengan radang dari parenkim. Pneumonia berat disertai dengan tanda
tarikan dinding dada bagian bawah kedalam (chest in drawing), pneumonia berat
disertai dengan tanda nafas cepat sesuai golongan umur.
Virus penyebab ISPA diantara lain adalah terdiri dari beberapa golongan
Miksovirus, Adenovirus, Koronavirus, Pikornavirus, Mikoplasma, Herpesvirus
dan lain-lain (Mennegethi,2009). Banyaknya mikroorganisme yang
menyebabkan terjadinya ISPA menyulitkan dalam klasifikasi dari segi kausa,
satu organisme dapat menyebabkan beberapa gejala klinis penyakit serta adanya
satu macam penyakit yang bisa disebabkan oleh berbagai macam
mikroorganisme tersebut (Heriyana,2009).
Faktor-faktor yang berperan pada kejadian ISPA adalah sebagai berikut :
1. Faktor host (diri)
a. Usia
Kebanyakan infeksi saluran pernafasan yang sering mengenai anak usia
dibawah 3 tahun, terutama bayi kurang dari 1 tahun. Beberapa penelitian
menunjukkan bahwa anak pada usia muda akan lebih sering menderita
ISPA dari pada usia yang lebih lanjut (Hidayat,2009).
b. Jenis kelamin
Meskipun secara keseluruhan di negara yang sedang berkembang seperti
Indonesia masalah ini tidak terlalu diperhatikan, namun banyak
penelitian yang menunjukkan adanya perbedaan prevelensi penyakit
ISPA terhadap jenis kelamin tertentu. Anak perempuan lebih tinggi dari
laki-laki di negara Denmark(Hidayat,2009).
c. Status gizi
Interaksi antara infeksi dan Kekurangan Kalori Protein (KKP) telah lama
dikenal, kedua keadaan ini sinergistik, saling mempengaruhi, yang satu
merupakan predisposisi yang lainnya. Pada KKP, ketahanan tubuh
2
2. Faktor lingkungan
a. Rumah
Merupakan stuktur fisik, dimana orang menggunakannya untuk tempat
berlindung yang dilengkapi dengan fasilitas dan pelayanan yang
diperlukan, perlengkapan yang berguna untuk kesehatan jasmani, rohani
dan keadaan sosialnya yang baik untuk keluarga dan individu (WHO,
1989). Anak-anak yang tinggal di apartemen memiliki faktor resiko lebih
2
tinggi menderita ISPA dari pada anak-anak yang tinggal di rumah culster
di Denmark (Hidayat,2009).
b. Kepadatan hunian
Seperti luas ruang per orang, jumlah anggota keluarga, dan masyarakat
diduga merupakan faktor risiko untuk ISPA. Penelitian oleh Koch et al
(2003) membuktikan bahwa kepadatan hunian (crowded) sangat
mempengaruhi secara bermakna prevalensi ISPA berat.
c. Status sosioekonomi
Telah diketahui bahwa kepadatan penduduk dan tingkat sosioekonomi
yang rendah mempunyai hubungan yang erat dengan kesehatan
masyarakat. Tetapi status keseluruhan tidak ada hubungan antara status
ekonomi dengan insiden ISPA, akan tetapi didapatkan korelasi yang
bermakna antara kejadian ISPA berat dengan rendahnya status
sosioekonomi (Hidayat,2009).
d. Kebiasaan merokok
Pada keluarga yang merokok, secara statistik anaknya mempunyai
kemungkinan terkena ISPA 2 kali lipat dibandingkan dengan anak dari
keluarga yang tidak merokok. Selain itu dari penelitian lain didapat
bahwa episode ISPA meningkat 2 kali lipat akibat orang tua merokok
(Hidayat,2009).
Preprocessing
Data Training
Prediksi
Classification
Decision Tree C4.5
Data Testing
METODE PENELITIAN
23
2
Visi
2. Kebutuhan hardware
Berikut adalah hardware yang digunakan dalam penelitian ini antara lain:
Pengujian
Model
Pengelolaan Pemodelan
Data Awal
Pengumpulan Evaluasi dan
Data Validasi Hasil
1. Pengumpulan Data
Tahapan pengumpulan data yang tepat yaitu dengan mempertimbangkan
penggunaannya berdasarkan jenis data dan sumbernya. Data yang objektif dan
relevan dengan pokok permasalahan penelitian yang merupakan indikator
keberhasilan suatu penelitian.
2. Pengelolaan Data Awal
Tahapan ini menjelaskan tahap awal dalam data mining. Data terkumpul
dan dinyatakan lengkap, data tersebut kemudian diseleksi atas dasar reliabilitas
dan validitas. Pengolahan data juga harus memperhtikan bentuk rumusan
masalah dan tujuan penelitian.
3. Pemodelan
Tahapan ini menjelaskan tentang pemilihan dan pemodelan metode yang
digunakan dengan metode algoritma C4.5 pada penelitian. Penjelasan ini juga
mengenai pengaturan untuk mendukung proses dan pemilihan nilai dari atribut-
atribut serta tahapan proses pemodelan dengan algoritma C4.5 yang digunakan.
4. Pengujian Model
Tahapan ini menjelaskan upaya pengujian model, sehingga karakteristik
atau sifat-sifat data tersebut dapat dengan mudah dipahami dan bermanfaat,
untuk menjawab masalah-masalah yang berkaitan dengan penelitian yang tepat
dari model atau metode algoritma C4.5 yang digunakan.
5. Evaluasi dan Validasi Hasil
Tahapan terakhir ini mejelaskan mengenai evaluasi dan validasi hasil
penerapan metode algoritma C4.5 pada penelitian yang dilakukan. Penjelasan
mengenai hal ini akan di bahas lebih jelas pada bab IV.
2
6 Status Gizi
7 Lingkungan Rokok
3.5 Metode Yang Diusulkan
Pada penelitian ini akan dilakukan analisa menggunakan algoritma C4.5
dalam tahapan ini akan dilakukan beberapa tahap pengujian data yaitu sebagai
berikut ini:
Karakteristik dari algoritma C4.5 yaitu salah satu algoritma dalam metode
pohon keputusan yang merubah suatu data menjadi pohon keputusan
menggunakan rumus perhitungan Entropy Split.
Data yang diperoleh terdiri dari: nama balita, umur balita, berat, batuk,
flue, demam, nafas berat, tenggorokan merah, status gizi, lingkungan rokok, dan
class ISPA (non pneumonia/pneumonia). Berikut tabel 3.1 menunjukan sebagian
dari dataset penyakit ISPA.
Nafas
Nama Umur Berat Batuk Flue Demam Tenggorokan Status Lingkungan
Class
Berat Merah Gizi Rokok
non
Alwi 3 2 1 2 1 1 2 2 2 pneumonia
non
Thariq 3 3 1 1 1 2 1 2 1 pneumonia
Saefudin 3 2 2 2 2 2 2 2 2 Pneumonia
non
Almalik 3 3 2 1 1 1 2 1 2 pneumonia
non
Alea 3 2 1 2 1 1 2 2 2 pneumonia
Azka 2 2 1 1 3 2 2 1 1 Pneumonia
Rafelin 3 2 1 2 2 2 1 1 2 Pneumonia
Afdal 2 2 2 1 2 2 1 1 2 Pneumonia
Refqi 2 1 2 1 2 2 1 2 2 Pneumonia
Melani 2 2 1 2 2 2 2 1 1 Pneumonia
non
Adelia 1 1 1 2 1 1 1 2 1 pneumonia
Alisa 2 2 2 2 2 1 2 2 2 Pneumonia
Adinda 3 3 2 1 2 2 2 2 1 Pneumonia
non
Reva 2 2 2 2 2 1 1 2 1 pneumonia
Zahra 2 2 2 2 3 2 1 2 2 Pneumonia
Paris 2 2 1 2 2 2 2 1 2 Pneumonia
Danis 3 2 2 2 2 2 1 2 2 Pneumonia
non
Khairul 2 2 1 1 1 2 2 2 2 pneumonia
Laila 3 2 1 2 2 2 2 2 2 Pneumonia
Ahmad 2 2 2 2 2 2 1 2 2 Pneumonia
2. Variabel Data
Variabel yang terdapat pada data penelitian ini meliputi variabel input dan
variabel output atau target.
a. Variabel Input
Variabel input merupakan variabel yang dinyatakan sebagai data
penyakit ISPA serta faktor-faktor yang meempengaruhi terjadinya
penyakit ISPA non pneumonia atau pneumonia. Berikut ini adalah
variabel input yang terdapat pada data penyakit ISPA yang akan
digunakan untuk mengklasifikasikan penyakit ISPA non pneumonia atau
pneumonia adalah nama, umur, berat, batuk, flue, demam, nafas berat,
tenggorokan merah, status gizi, lingkungan rokok dan class.
3
b. Variabel Target
Variabel target meyatakan sebagai hasil dari penilaian yang dilakukan
terhadap variabel input. Sedangkan variabel target dari hasil penelitian
ini adalah atribut “Class” yang diberikan label “Non pneumonia dan
Pneumonia”.
3. Penjelasan Data
Setelah data dikumpulkan maka dilakukan pembelajaran mengenai data
yang akan digunakan. Data diharapkan dapat mmembantu penulis dengan data-
data yang sudah dikumpulkan dapat menemukan wawasan awal mengenai
informasi yang bisa didapatkan didalamnya.
Nama X -
Tenggorokan
Y Nilai Variabel
Merah
Status Gizi Y Nilai Variabel
Lingkungan
Y Status Target
Rokok
Pada tabel diatas menjelaskan tribut yang akan dipakai dalam penelitian ini.
Indikator “Y” menadakan bahawa atribut tersebut akan digunakan, sedangkan
atribut “X” menandakan bahwa atribut tersebut akan di eliminasi pada tahap
pengolahan data awal. Eliminasi akan dilakukan berdasarkan nilai model yang
relative antara satu data penyakit ISPA dengan data yang lainnya, sehingga tidak
akan berpengaruh terhadap hasil.
2. Transformation
Setelah data sudah dipilih maka akan dilakukan tahapa berikutnya yaitu
transformasi terhadap atribut, transformasi akan dilakukan untuk memodifikasi
sumber data ke format berbeda yang dapat diterima oleh proses data mining
pada tahapan selanjutnya. Tranformasi nilai-nilai dari atribut juga perlu
dilakukan karena jangkauan nilainya terlalu lebar, sehingga dapat menyebabkan
proses pengenalan pola data dan pembentukan pohon keputusan menjadi lambat.
Ada berbagai macam jenis atribuut pada data mining, diantaranya yaitu:
a. Atribut Nominal adalah simbol atau nama-nama dari suatu benda, setiap
nilai merupakan semacem kategori, kode, atau status dan sebagainya
sehingga atribut ini juga disebut sebagai kategorikal.
b. Atribut Biner adalah atribut nominal yang hanya berisi dua jenis nilai saja.
3
Pada penelitian ini jenis atribut yang ada pada data awal berupa atribut
nominal (umur, berat badan, demam), ordinal (nama), biner (tenggorokan merah,
lingkungan rokok, status gizi, nafas berat, batuk dan flue), dari atribut yang ada
selanjutnya atribut akan ditransformasi ke dalam bentuk atribut numerik agar
memudahkan dalam proses pemodelan. Berikut ini merupakan transformasi yang
dilakukan pada atribut yaitu:
Keterangan Penyederhanaan
Bayi (0-1Tahun) 1
Keterangan Penyederhanaan
Keterangan Penyederhanaan
Tidak 1
Ya 2
3
Keterangan Penyederhanaan
Tidak 1
Ya 2
Keterangan Penyederhanaan
Keterangan Penyederhanaan
Tidak 1
Ya 2
Keterangan Penyederhanaan
Tidak 1
Ya 2
Keterangan Penyederhanaan
3
Kurang 1
Cukup 2
Keterangan Penyederhanaan
Tidak 1
Ya 2
3. Cleaning
Pada tahapan berikut ini akan dilakukan proses pembersihan data untuk
memastikan data yang telah dipilih itu layak atau tidak untuk dilakukan
pemodelan. Kegiatan yang ada pada tahap ini antara lain untuk membersihkan
dan memperbaiki data rusak, menghapus data yang tidak diperlukan serta
memperbaiki data rusak. Pada tahap ini akan dilakukan menghilangkan atribut
nama, tahun, bulan, C dan kg yang akan digunakan pada proses pemodelan.
non
2 2 2 2 2 1 1 2 1 pneumonia
2 2 2 2 3 2 1 2 2 Pneumonia
2 2 1 2 2 2 2 1 2 Pneumonia
3 2 2 2 2 2 1 2 2 Pneumonia
non
2 2 1 1 1 2 2 2 2 pneumonia
3 2 1 2 2 2 2 2 2 Pneumonia
2 2 2 2 2 2 1 2 2 Pneumonia
4. Cross Vallidation
Nilai k yang digunakan yaitu 5 atau 10, biasa disebut 10 folds cross
validation, yaitu data dibagi menjadi 10 bagian , 90% untuk training dan 10%
lainnya digunakan sebagai testing. Proses dilakukan berulang sampai dengan 10
kali atau 10 iterasi sampai semua record data mendapatkan bagian sebagai data
testing(Indrayanti, Sugianti, & Karomi, 2017).
Pembagian data dengan cara kerja k-folds cross validation, yaitu total data
dibagi menjadi n bagian, iterasi atau fold ke 1, yaitu bagian ke 1 menjadi testing,
bagian sisanya menjadi data training interval sampel atau juga disebut sampling
rasio di peroleh dengan cara membagi ukuran sampel yang dikehendaki (N/n).
Pada fold ke 2, dimana bagian ke 2 yang menjadi testing, sisanya menjadi
training, kemudian hitung akurasinya, proses tersebut berulang sampai
mencapai fold ke -
k. Hitung rata-rata dari semua nilai k, hasil akurasi tersebut merupakan hasil
akurasi akhir.
Pada proses validasi hasil klasifikasi, pada penelitian ini dilakukan dengan
menggunakan metode decision tree C4.5 pada data training. Setelah itu
dilanjutkan proses evaluasi dengan confusion table dan ROC curve. Hasil
confusion table digunakan untuk menyajikan accuracy, recall, dan precision
dalam algortima klasifikasi. Accuracy merupakan persentase antara nilai prediksi
dengan nilai sebenarnya yang ada. Recall merupakan persentase nilai kinerja
keberhasilan algoritma yang dipakai. Precision merupakan nilai akurasi dengan
class yang telah diprediksi. Berikut merupakan tabel confusion dapat dilihat
pada tabel berikut ini:
3
Nilai Prediksi
Confusion Matrix
Non
Pneumonia= Pneumonia= p
NP
Non
Sebenarnya NP
Pneumonia = P FP TP
TNP+TP
Rumus Accuracy: Accuracy =
(TNP+FNP+TP+FP)
TNP
Rumus Recall: Recall =
(TNP+FP)
TNP
Rumus Precision: Precision =
(TNP+FNP)
5. Pemodelan
Pada penelitian ini akan dilakukan pemodelan menggunakan metode
algoritma C4.5 untuk pengolahan data penyakit ISPA. Berikut ini beberapa
tahapan proses pemodelan dalam penelitian ini yaitu:
1. Choosing The Appropriate Data Mining Task
Pada tahapan ini memilih jenis data mining yang digunakan. Pada
penelitian untuk prediksi penyakit ISPA yang terkena pneumonia makan
dipilih jenis data mining yang digunakan adalah klasifikasi.
2. Choosing The Data Mining Algoritma
Tahap ini setelah pemilihan jenis data mining yang dilakukan yaitu
klasifikasi, maka selanjutnya menentukan algoritma klasifikasi yang akan
digunakan. Pada penelitian ini menggunakan algoritma C4.5.
3. Employing The Data Mining Algoritma
Tahap ini dilakukan untuk pengolahan data mining dengan tingkat
akurasi yang tinggi dalam klasifikasi prediksi penyakit ISPA non
pneumonia atau pneumonia.
4. Evaluation
Pada tahap ini dilakukan evaluasi dan menafsirkan pola yang didapatkan
dari hasil algoritma yang dipakai untuk mengetahui faktor, gejala dan lain-
lain. Evaluasi yang dilakukan ini menerapkan pola yang didapat dari proses
sebelumnya terhadap data testing yang di sediakan. Evaluasi dilakukan
dengan confusion matrix dan kurva ROC.
5. Using The Discovered Knowledge
Pada tahapan ini menggunakan pengetahuan yang didapat dari proses
data mining untuk penerapan pada aplikasi atau yang lainnya. Pengetahuan
klasifikasi untuk memprediksi penyakit ISPA non pneumonia atau
pneumonia yang diterapkan pada data baru untuk membuat klasifikasi
penyakit ISPA non pneumonia dan juga pneumonia.
BAB IV
Setelah hasil entropy total diketahui maka selanjutnya mencari hasil entropy
dan gain pada masing-masing atribut untuk menentukan akar pohon pada dataset
penyakit ISPA. Berikut ini tabel hasil perhitungan entropy atribut untuk
menentukan akar pohor pada Decision Tree C4.5:
39
4
Label
Atributte Value Jml kasus Entropy Gain Ratio
non
Pneumonia pneumonia
Entropy total 122 38 160 0.790858091
Umur 0.00941298
1 39 17 56 0.885612871
2 45 12 57 0.742487570
3 38 9 47 0.704576713
Berat 0.007869026
1 43 15 58 0.824657833
2 69 22 91 0.797951968
3 10 1 11 0.439496987
Batuk 0.000832445
1 31 11 42 0.829607103
2 91 27 118 0.775937331
-
Flue 0.011219068
1 23 6 29 0.802077159
2 99 32 131 0.802077159
Demam 0.27837428
1 6 21 27 0.764204507
2 68 17 85 0.721928095
3 48 0 48 0
Nafas Berat 0.159393135
1 12 22 34 0.936667382
2 110 16 126 0.549108745
Tenggorokan
0.021838137
Merah
1 45 7 52 0.569961376
2 77 31 108 0.864862972
Status Gizi 0.001160594
1 13 3 16 0.69621226
2 109 35 144 0.800084745
Lingkungan Rokok 0.015206356
1 37 6 43 0.583019417
2 85 32 117 0.846448228
4
Batuk 0.168590632
1 3 2 5 0.970950594
2 1 6 7 0.591672779
2 60 9 69 0.558629373
Berat 0.16970017
1 2 4 6 0.918295834
2 4 3 7 0.985228136
3 2 0 2 0
4
Batuk 0.469565211
1 0 2 2 0
2 4 1 5 0.721928095
Umur 0.721928095
1 0 1 1 0
2 4 0 4 0
3 0 0 0 0
Label
Atributte Value Jml kasus Entrophy Gain Ratio
Pneumonia non pneumonia
1 0 1 1 0
2 4 0 4 0
3 0 0 0 0
Flue 0
1 0 0 0 0.721928095
2 4 1 5 0.721928095
Tenggorokan
Merah 0.0729056
1 1 0 1
0
4
2 3 1 4 0.811278124
Status Gizi 0
1 0 0 0 0
2 4 1 5 0.721928095
Lingkungan
Rokok 0.32192809
1 1 1 2 1
2 3 0 3 0
Klik read excel lalu pada pojok kanan atas klik import configuration wizard.
Setelah itu pilih dataset, pemilihan dataset disajikan pada gambar 4.2 sebagai
berikut ini:
4
Klik tombol next, lalu next lagi, setelah itu pilih hasil keputusan binominal
dan label, dari 10 atribut yang digunakan 9 atribut dan 1 atribut menjadi atribut
class. Sedangkan yang lainnya sebagai integer dan atribut. Setelah itu klik
finish. Lalu pilih cross validation pada kolom operators, dan pada kolom cross
validation klik dua kali untuk proses pada cross validation. Gambar pemilihan
hasil keputusan sebagai tabel (dataset ISPA) disajikan pada gambar 4.3 sebagai
berikut ini:
Setelah itu klik proses untuk masuk ke gambar read excel dan validation.
Tarik garis dan sambung pada setiap kotaknya, pada kotak validation sambung
empat garis. Setelah proses dilakukan klik start the execution (segitiga biru
diatas) yang ada pada border untuk proses run. Pada gambar 4.5 berikut :
4
2. Recall
Hasil Recall pada pengujian menggunakan algoritma klasifikasi Decision
Tree C4.5 adalah 63.50%, dengan 90.98% pada class pneumonia dan 60,53%
pada class non pneumonia, terlihat pada gambar berikut:
3. Precision
Hasil precision pada pengujian menggunakan algoritma klasifikasi
Decision Tree C4.5 adalah 73.10%, dengan 88.10% pada class pneumonia dan
67.65% pada class non pneumonia, terlihat pada gambar berikut:
Gambar 4.9 Hasil AUC (Area Under Curve) Decision Tree C4.5
PerformanceVector
PerformanceVector:
accuracy: 83.75% +/- 11.59% (mikro: 83.75%)
ConfusionMatrix:
True: pneumonia non pneumonia
pneumonia: 111 15
non pneumonia:11 23
AUC (optimistic): 0.938 +/- 0.076 (mikro: 0.938) (positive
class: non pneumonia)
AUC: 0.790 +/- 0.153 (mikro: 0.790) (positive class: non
pneumonia)
AUC (pessimistic): 0.669 +/- 0.228 (mikro: 0.669) (positive
class: non pneumonia)
precision: 73.10% +/- 25.84% (mikro: 67.65%) (positive class:
non pneumonia)
ConfusionMatrix:
True: pneumonia non pneumonia
pneumonia: 111 15
non pneumonia:11 23
4
Berikut meta data view dataset disajikan pada Gambar sebagai berikut:
R3 Jika demam >1.500 dan jik nafas berat ≤1.500 dan jika berat
>2.500 maka pneumonia.
5
R4 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah ≤2.500 maka pneumonia.
R5 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah >1.500 dan jika batuk
≤1.500 non pneumonia.
R6 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah >1.500 dan jika batuk
>1.500 dan jika umur ≤1.500 maka pneumonia.
R7 Jika demam >1.500 dan jika nafas berat ≤1.500 dan jika berat
≤2.500 dan jika tenggorokan merah >1.500 dan jika batuk
>1.500 dan jika umur ≤1.500 maka non pneumonia.
R9 Jika demam ≤1.500 dan jika umur >2.500 dan jika lingkungan
rokok ≤1.500 maka pneumonia.
R10 Jika demam ≤1.500 dan jika umur >2.500 dan jika lingkugan
rokok >1.500 dan jika batuk >1.500 maka non pneumonia.
Pada pohon keputusan (Decision Tree) algoritma C4.5 penyakit ISPA jika
dijabarkan kedalam bahasa yang lebih sederhana dan dibuat dalam bentuk pohon
text maka akan diperoleh hasil sebagai berikut:
5
Tree
4.2 Pembahasan
5
Pengujian
Criterion
Decision
Accuracy 83,75%
Recall 63,50%
Precision 73,10%
AUC 0,790
5.1 Kesimpulan
Berdasarkan hasil penelitian yang telah dilakukan menggunakan
penambangan data algoritma C4.5 untuk mengklasifikasi penyakit ISPA Non
Pneumonia atau Pneumonia, dapat diambil kesimpulan sebagai berikut:
1. Data Mining untuk mengklasifikasi penyakit ISPA Non Pneumonia atau
Pneumonia dapat diimplementasikan dengan baik menggunakan algoritma
C4.5 pada rapidminer.
2. Pengujian yang dilakukan terhadap 160 data menggunakan confusion matrix
dan ROC curve menghasilkan tingkat keakuratan sebesar 0.790% dengan
+/- 0.153% serta mikro 0.790%. Jika melihat dengan kurva ROC
menggunakan dataset dengan akurasi fair classification sebesar 0.790. Nilai
keakuratan tersebut dapat dikatakan cukup untuk digunakan dalam
memprediksi jenis penyakit ISPA.
5.2 Saran
Saran yang dapat diberikan untuk mengembangkan penelitian yang akan
datang adalah :
1. Pendekatan klasifikasi yang mampu menerima masukan dengan jumlah
atribut yang bervariasi di penelitian mendatang.
2. Penelitian selanjutnya diharapkan dapat mengembangkannya dalam suatu
aplikasi.
3. Memaksimalkan atau menambah dataset yang lebih banyak agar prediksi
data penyakit ISPA Non Pneumonia atau Pneumonia semakin akurat.
54
5
DAFTAR PUSTAKA
Fadlina, 2014. Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan
Algoritma Association Rule Metode Apriori. Informasi dan Teknologi
Ilmiah(INTI). Vol 3 No.1, Mei 2014.
Fadillah, Sarah. (2013). “Implementasi Data Mining Untuk Pengenalan
Karakteristik Transaksi Customer Dengan Menggunakan Algoritma C4.5.”
Pelita Informatika Budi Darma, Vol. 5, No. 3. 2301-9425.
5
G.Liang , 2005. "A Comparative Study of Three Decision Tree Algoritms ID3,
Fuzzy ID3 and Probabilistic Fuzzy ID3," Rotterdam University ,
Netherlands.
Gorunescu, F., 2011. “Data Mining Concept Model and Techniques”, Berlin:
Springer.
Hidayat N. 2009. Faktor-Faktor Yang Berhubungan Dengan Kejadian Penyakit
IspaPada Balita Di Kelurahan Pasie Nan Tigo Kecamatan Koto Tangah
KotaPadang.
Hidayat, M. N, (2009). Hubungan Lingkungan Fisik Rumah Dengan Kejadian
ISPA.
I. H. Witten, E. Frank, and M. A. Hall. 2011. Data Mining Practical Machine
Learning Tools and Technique. Burlington: Morgan Kaufmann Publisher.
Indrayanti, Sugianti, D., & Karomi, M. A. Al. (2017). Optimasi Parameter K Pada
Algoritma K-Nearest Neighbour untuk Klasifikasi Penyakit Diabetes
Mellitus, 551–554.
Jantan, Hamidah., Razak Hamdan., Abdul dan Ali Othman, Zulaiha. (2010).
“Human Talent Prediction in HRM using C4.5 Classification Algorithm.”
International Journal on Computer Science and Engineering, Vol. 02, No.
08. 2526-2534.
Kochet al. 2003. Housing and Health : Time Again for Public Health Action.
American Journal of Public Health: May, Vol 92, No 5. p 758-768.
Kusrini dan Taufiq Luthfi, Emha. (2009). “ Algoritma Data Mining.” Yogyakarta:
Andi.
Lianto, Joko., Umi Hanik, dan AhmadSaikhu, 2011. “Fuzzy Decision Tree dengan
Algoritma C4.5 Pada data Diabetes Indian Pima”, Sistem dan
Informatika,pp. 1-3, 2011.
Permatasari, C.A.E. 2009. Faktor Risiko Gejala ISPA Ringan pada Baduta di
Rangkapan Jaya Baru Kota Depok 2008. Universitas Indonesia. Depok
Prameswari, G.N. 2009. Hubungan Lama Pemberian Asi Secara Ekslusif Dengan
Frekuensi Kejadian ISPA. Universitas Negeri Semarang, Indonesia. Jurnal
Kesehatan Masyarakat 5 : 30.
Prasetyo.E, 2014. Data Mining Mengolah Data Menjadi Informasi Menggunakan
Matlab. Andi. Yogyakarta.
Ranuh, IGN. (1997). Masalah ISPA dan Kelangsungan Hidup Anak. Surabaya :
Continuing Education. Ilmu Kesehatan Anak.
Rudianto. 2013. Faktor-faktor yang Berhubungan dengan Gejala Infeksi Saluran
Pernapasan Akut (ISPA) pada Balita di 5 Posyandu Desa Tamansari
Kecamatan Pangkalan Karawang Tahun 2013. Jakarta.
5
LAMPIRAN
5
Pneumonia
2 2 2 1 2 2 2 2 2
Pneumonia
2 2 2 1 3 2 1 2 2
Pneumonia
2 2 2 2 2 2 2 2 1
Pneumonia
2 2 1 2 3 2 2 2 2
non
2 1 2 2 1 1 2 2 2 pneumonia
non
1 1 2 2 2 1 2 2 2 pneumonia
Pneumonia
1 1 2 2 2 2 2 1 1
Pneumonia
2 2 2 2 2 2 1 2 2
non
1 1 1 2 2 1 2 2 2
pneumo
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
1 1 1 2 3 2 2 2 1
Pneumonia
3 3 2 2 2 2 2 2 2
Pneumonia
3 2 2 2 2 2 2 2 2
Pneumonia
2 1 2 2 2 2 1 2 1
Pneumonia
3 2 1 2 2 2 2 2 2
Pneumonia
1 1 2 2 3 2 1 1 2
Pneumonia
1 1 2 1 2 2 2 2 2
non
1 1 1 2 2 2 2 2 2
pneumo
pneumonia
1 1 2 2 2 2 1 2 1
pneumonia
3 3 2 2 2 2 2 1 2
Pneumonia
1 1 2 1 3 2 2 2 2
Pneumonia
2 2 1 2 2 2 2 2 2
Pneumonia
2 2 2 2 2 2 2 2 2
Pneumonia
2 2 2 2 3 2 2 1 2
Pneumonia
3 3 2 2 2 1 2 2 2
non
3 2 2 2 1 1 2 2 2 pneumo
Pneumonia
3 3 2 2 2 2 1 2 2
Pneumonia
3 2 1 2 3 2 2 2 1
Pneumonia
1 1 2 2 2 2 1 2 1
Pneumonia
2 2 2 2 3 2 1 2 1
non
3 2 2 2 1 2 1 2 2 pneumonia
non
2 2 2 1 2 2 2 2 2 pneumonia
Pneumonia
3 2 2 2 1 2 2 2 2
Pneumonia
2 2 1 2 2 2 2 2 2
Pneumonia
3 2 2 2 3 2 1 1 2
6
Pneumonia
2 2 2 2 2 2 1 2 2
Pneumonia
3 2 2 1 3 2 2 2 1
non
2 2 2 2 1 1 2 2 2
pneumo
non
2 2 1 2 2 1 2 2 2
pneumo
Pneumonia
1 2 2 1 2 2 2 2 2
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
1 1 2 2 3 2 2 2 1
Pneumonia
1 1 1 2 3 2 2 2 2
Pneumonia
1 1 2 2 2 1 2 2 2
Pneumonia
2 1 2 1 3 2 2 2 2
Pneumonia
1 1 2 2 3 2 2 1 2
Pneumonia
2 1 2 2 2 2 2 2 2
non
2 1 2 2 2 1 2 2 2 pneumonia
non
1 2 2 2 1 2 1 2 2 pneumonia
non
1 1 2 1 2 2 2 2 2 pneumonia
Pneumonia
2 2 2 2 3 2 1 2 1
Pneumonia
3 2 1 2 1 1 2 2 2
Pneumonia
3 2 2 2 3 2 1 2 2
Pneumonia
3 3 2 2 3 2 2 2 1
Pneumonia
2 2 2 2 2 2 1 2 2
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
3 2 2 2 3 2 2 2 1
Pneumonia
2 1 1 2 2 2 2 2 2
Pneumonia
2 2 2 2 2 2 2 2 2
non
3 2 2 2 1 2 2 2 2 pneumonia
Pneumonia
2 2 2 2 2 2 2 2 1
Pneumonia
1 1 2 1 3 2 2 2 2
Pneumonia
1 2 2 2 2 2 1 2 2
Pneumonia
1 1 2 2 3 2 1 2 1
Pneumonia
1 1 2 2 3 2 1 2 1
Pneumonia
2 2 2 2 3 2 2 2 1
Pneumonia
3 3 1 2 2 1 2 2 2
non
1 2 2 1 2 2 2 1 2 pneumonia
non
1 1 2 2 2 2 2 2 2 pneumonia
6
Pneumonia
1 1 2 2 2 2 2 2 1
Pneumonia
2 2 2 1 3 2 1 2 2
Pneumonia
2 2 1 2 2 2 2 2 2
Pneumonia
3 2 1 2 2 2 2 2 2
Pneumonia
2 2 1 2 3 2 2 2 2
Pneumonia
1 1 2 2 3 2 2 2 1
Pneumonia
2 2 2 2 2 2 2 2 1
non
1 1 2 2 2 2 2 2 2 pneumonia
non
1 1 1 2 2 1 2 2 2 pneumonia
Pneumonia
1 1 2 2 3 2 1 2 2
non
1 1 2 2 1 1 2 2 2 pneumo
Pneumonia
3 1 2 2 2 2 2 2 2
Pneumonia
1 1 2 2 2 2 1 2 2
Pneumonia
1 1 1 2 3 2 2 2 1
Pneumonia
1 1 2 1 3 2 1 2 2
Pneumonia
1 1 2 2 2 2 2 2 2
Pneumonia
1 1 2 2 2 2 2 2 2
Pneumonia
2 2 1 2 3 2 2 2 2
Pneumonia
2 2 1 2 3 2 2 2 2
Pneumonia
1 1 2 2 2 2 2 2 2
Pneumonia
3 2 2 2 2 2 2 2 2
Pneumonia
2 2 2 1 3 2 1 2 1
non
1 1 2 2 2 1 2 2 2 pneumonia
non
1 1 2 2 1 2 2 2 2 pneumonia
Pneumonia
1 1 2 2 3 2 2 2 2
non
3 2 2 2 1 1 2 2 2 pneumo
non
3 1 2 2 1 1 2 2 2 pneumo
non
1 2 2 2 1 2 1 2 1 pneumo
non
2 2 2 2 2 2 2 2 2 pneumo
Pneumonia
3 2 2 2 1 1 2 2 1
non
3 2 1 2 2 1 2 2 1 pneumo
non
1 1 2 2 1 1 2 2 2 pneumo
Pneumonia
3 2 2 2 2 2 2 2 1
6
Pneumonia
3 2 1 2 2 2 2 2 1
Pneumonia
2 2 2 2 3 2 1 2 2
non
2 2 2 2 1 1 2 2 2
pneumo
non
1 2 2 2 1 2 1 2 1
pneumo
Pneumonia
3 2 2 2 3 2 1 2 2
non
1 2 2 2 2 1 2 2 1
pneumo
non
3 2 1 2 1 1 2 2 2
pneumo
Pneumonia
1 1 2 2 2 2 1 2 2
Pneumonia
1 1 2 1 2 2 2 2 2
Pneumonia
2 2 2 2 3 2 1 2 1
Pneumonia
2 2 2 2 2 1 2 2 2
non
2 2 1 2 1 1 2 2 2 pneumonia
Pneumonia
2 2 2 1 2 2 2 2 2
non
3 2 1 2 1 1 2 2 2 pneumo
non
2 2 2 2 2 2 1 2 2
pneumo
Pneumonia
1 1 2 2 3 2 1 2 2
Pneumonia
3 2 2 1 2 2 2 2 1
Pneumonia
2 2 2 2 2 2 2 2 2
Pneumonia
3 2 2 2 3 2 2 2 2
Pneumonia
1 1 1 2 3 2 1 2 2
Pneumonia
2 1 1 2 2 2 1 2 2
Pneumonia
2 2 2 1 3 2 2 2 1
Pneumonia
3 2 2 2 2 2 2 2 2
Pneumonia
1 1 1 1 2 1 1 1 1
6
Entropy (total) =
0.790858091
Menghitung nilai entropy pada masing-masing atribut kelas:
1. Menghitung nilai entropy atribut kelas umur:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
a. Atribut umur 1 tahun:
Jumlah kasus (S)= 56
Jumlah kasus (P/S1)= 39
Jumlah kasus (Np/S2)= 17
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −39 × log 2( 39)) + ( −17 × log 2(17))
56 56 56 56
Entropy = 0.885612871
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 57
Jumlah kasus (P/S1)= 45
Jumlah kasus (Np/S2)=12
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −45 × log 2( 45)) + ( −12 × log 2(12))
57 57 57 57
Entropy = 0.74248757
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 47
Jumlah kasus (P/S1)= 38
Jumlah kasus (Np/S2)= 9
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −38 × log 2( 38)) + ( −9 × log 2( 9 ))
47 47 47 47
Entropy = 0.704576713
6
Entropy = 0.824657833
b. Atribut berat 2:
Jumlah kasus (S)= 91
Jumlah kasus (P/S1)= 69
Jumlah kasus (Np/S2)= 22
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−69
Entropy = ( × log 2( 69)) + ( −22 × log 2(22))
91 91 91 91
Entropy = 0.797951968
c. Atribut berat 3:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 10
Jumlah kasus (Np/S2)=1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−10
Entropy = ( × log 2( 10)) + ( −1 × log 2( 1 ))
11 11 11 11
Entropy = 0.439496987
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kaus (S)= 42
Jumlah kasus (P/S1)= 31
Jumlah kasus (Np/S2)= 11
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −31 × log 2( 31)) + ( −11 × log 2(11))
42 42 42 42
Entropy = 0.829607103
b. Atribut batuk 2:
Jumlah kasus (S)= 118
Jumlah kasus (P/S1)= 91
Jumlah kasus (Np/S2)= 27
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
6
Entropy =
0.775937331
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kaus (S)= 29
Jumlah kasus (P/S1)= 23
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−23
Entropy = ( × log 2( 23)) + ( −6 × log 2( 6 ))
29 29 29 29
Entropy = 0.802077159
b. Atribut flue 2:
Jumlah kaus (S)= 131
Jumlah kasus (P/S1)= 99
Jumlah kasus (Np/S2)= 32
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−99
Entropy = ( × log 2( 99
)) + ( −32 × log 2( 32 ))
131 131 131 131
Entropy =
0.802077159
5. Menghitung nilai entropy atribut kelas demam:
a. Atribut demam 1:
Jumlah kasus (S)= 27
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 21
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −21 × log 2(21))
27 27 27 27
Entropy = 0.764204507
b. Atribut demam 2:
Jumlah kasus (S)= 85
Jumlah kasus (P/S1)= 68
Jumlah kasus (Np/S2)= 17
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−68
Entropy = ( × log 2( 68)) + ( −17 × log 2(17))
85 85 85 85
Entropy = 0.721928095
c. Atribut demam 3:
Jumlah kasus (Np/S2)=
6
Jumlah kasus (S)= 48
Jumlah kasus (P/S1)= 48
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−48
Entropy = ( × log 2( 48)) + ( −0 × log 2( 0 ))
48 48 48 48
Entropy = 0
6. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat 1:
Jumlah kasus (S)= 34
Jumlah kasus (P/S1)= 12
Jumlah kasus (Np/S2)= 22
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −12 × log 2( 12)) + ( −22 × log 2(22))
34 34 34 34
Entropy = 0.936667382
b. Atribut nafas berat 2:
Jumlah kasus (S)= 126
Jumlah kasus (P)= 110
Jumlah kasus (Np/S2)= 16
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −110 × log 2( 110)) + ( −16 × log 2( 16 ))
126 126 126 126
Entropy =
0.549108745
7. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 52
Jumlah kasus (P/S1)= 45
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−45
Entropy = ( × log 2( 45)) + ( −7 × log 2( 7 ))
52 52 52 52
Entropy = 0.569961376
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 108
Jumlah kasus (P/S1)= 77
Jumlah kasus (Np/S2)= 31
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−77
Entropy = ( × log 2( 77
)) + ( −31 × log 2( 31 ))
108 108 108 108
Entropy = 0.864862972
8. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (P/S1)=
6
Jumlah kasus (S)= 16
Entropy = 0.69621226
b. Atribut status gizi 2:
Jumlah kasus (S)= 144
Jumlah kasus (P/S1)= 109
Jumlah kasus (Np/S2)= 35
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −109 × log 2( 109)) + ( −35 × log 2( 35 ))
144 144 144 144
Entropy = 0.800084745
9. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 43
Jumlah kasus (P/S1)= 37
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−37
Entropy = ( × log 2( 37)) + ( −6 × log 2( 6 ))
43 43 43 43
Entropy = 0.583019417
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 117
Jumlah kasus (P/S1)= 85
Jumlah kasus (Np/S2)= 32
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −85 × log 2( 85
)) + ( −32 × log 2( 32 ))
117 117 117 117
Entropy = 0.846448228
Menghitung nilai gain pada masing-masing atribut kelas untuk menentukan akar
pohon:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛 umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
𝑖=0 total
Gain(total,umur) = 0.790858091 – (( 56 ×0.885612871) +
160
( 57 ×0.742487570) + ( 47 ×0.704576713)
160 160
Gain(total,berat) = 0.790858091 – (( 58
160
×0.824657833) +
91
( ×0.797951968) + ( 11
×0.439496987)
160 160
Gain (total,berat) = 0.007869026
3. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛
𝑖=0 total
Gain(total,batuk) = 0.790858091 – (( 42 ×0.829607103) +
160
118
( ×0.775937331)
160
Gain (total,batuk) = 0.000832445
4. Menghitung nilai gain atribut kelas flue:
Gain (total,flue) = Entropy (total) – flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
∑𝑛
𝑖=0 total
Gain(total,flue) = 0.790858091 – (( 29 ×0.802077159) +
160
(131 ×0.802077159)
160
Gain (total,flue) = -0.011219068
5. Menghitung nilai gain atribut kelas demam:
Gain (total,demam) = Entropy (total) – ∑𝑛 demam
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(demam)
𝑖 total
Gain(total,demam) = 0.790858091 – (( 27 ×0.764204507) +
160
85
( ×0.721928095) + ( 48
×0)
160 160
Gain (total,demam) = 0.27837428
6. Menghitung nilai gain atribut kelas nafas berat:
Gain (total,nafas berat) =Entropy(total)– nafas berat
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.790858091 – (( 34 ×0.936667382) +
160
(126 ×0.549108745)
160
Gain (total,nafas berat) = 0.159393135
7. Menghitung nilai gain atribut kelas status tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy(total) – tenggorokan merah
∑𝑛 𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.790858091 – (( 52 ×0.569961376)
160
+ (108 ×0.864862972)
160
Gain (total,tenggorokan merah) = 0.021838137
8. Menghitung nilai gain atribut kelas status gizi:
Gain(total,status gizi) =Entropy(total) – status gizi
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.790858091 – (( 16 ×0.69621226) +
160
(144 ×0.800084745)
160
Gain (total,status gizi) = 0.001160594
9. Menghitung nilai gain atribut kelas lingkungan rokok:
7
Cari nood berikutnya dengan cara yang sama seperti pada perhitungan nood
pertama, cari nood berikutnya dengan memfilter data berdasarkan nilai atribut
demam.
Perhitungan nood (root) untuk mencari entropy demam 1:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 27
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 21
Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy (total) = ( −6 × log 2( 6 )) + ( −21 × log 2(21))
27 27 27 27
Entropy = 0
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −6 × log 2(6))
6 6 6 6
Entropy = 0
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 6
7
Entropy = 0.985228136
2. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −6 × log 2(6))
6 6 6 6
Entropy = 0
b. Atribut berat 2:
Jumlah kasus (S)= 19
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 14
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −14 × log 2(14))
19 19 19 19
Entropy = 0.831474388
c. Atribut berat 3:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2
Entropy = 1
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −6 × log 2( 6 ))
10 10 10 10
Entropy = 0.970950594
b. Atribut batuk 2:
Jumlah kasus (S)= 17
7
Entropy = 0.522559375
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 3
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −2 × log 2(2))
3 3 3 3
Entropy = 0.738284866
b. Atribut flue 2:
Jumlah kasus (S)= 24
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 19
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −19 × log 2(19))
24 24 24 24
Entropy = 0.738284866
5. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat 1:
Jumlah kasus (S)= 18
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 14
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −14 × log 2(14))
18 18 18 18
Entropy = 0.764204507
b. Atribut nafas berat 2:
Jumlah kasus (S)= 9
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −7 × log 2(1))
9 9 9 2
Entropy = 0.764204507
6. Menghitung nilai entropy atribut kelas tenggorokan merah:
7
Entropy = 0.650022422
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 21
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 16
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −16 × log 2(16))
21 21 21 21
Entropy = 0.791858353
7. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−0
Entropy = ( × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1
Entropy = 0
b. Atribut status gizi 2:
Jumlah kasus (S)= 26
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 20
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −20 × log 2(20))
26 26 26 26
Entropy = 0.779349837
8. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( −2 × log 2(2))
6 6 6 6
Entropy = 0.918295834
7
Entropy = 0.702466551
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛 umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
𝑖=0 total
Gain(total,umur) = 0.764204507 – (( 7 ×0) + ( 6 × 0) +
27 27
(14 ×0.985228136)
27
Gain (total,umur) = 0.253345473
2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – ∑𝑛𝑖=0berat × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
total
6
Gain(total,berat) = 0.764204507 – (( ×0) + (19 ×0.831474388) +
27 27
( ×1)
2
27
Gain (total,berat) = 0.105018826
3. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛
𝑖=0 total
Gain(total,batuk) = 0.764204507 – ((10 ×0.970950594)
27
+ (17 ×0.522559375)
27
Gain (total,batuk) = 0.07557431
4. Menghitung nilai gain atribut kelas flue:
Gain (total,flue) = Entropy (total) – flue
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(flue)
∑𝑛
Gain(total,flue) = 0.764204507 – (( 3 𝑖=0 total
27
×0.738284866) + (24 ×0.738284866)
27
Gain (total,flue) = 0.02591964
5. Menghitung nilai gain atribut kelas nafas berat:
Gain(total,nafas berat) = Entropy (total) – nafas berat
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(nafas berat)
Gain(total,nafas berat) = 0.764204507 – ((18 ×0.764204507)
27
+ ( 9 × 0.764204507)
27
Gain (total,nafas berat) =0
6. Menghitung nilai gain atribut kelas tenggorokan merah:
Gain(total,tenggorokan merah) = Entropy (total) – ∑𝑛 tenggorokan merah
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
7
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.764204507 – (( 1 ×0) +
27
((26 ×0.779349837)
27
Gain (total,status gizi) = 0.013719478
8. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.764204507 – (( 6 ×0.918295834) +
27
21
(( ×0.702466551)
27
Gain (total,tenggorokan merah) = 0.013775892
Perhitungan nood (root) untuk mencari entropy umur 3:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 8
Entropy (total) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy (total) = ( × log 2( 6 )) + ( −8 × log 2( 8 ))
14 14 14 14
Entropy = 0
b. Atribut berat 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 6
7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −6 × log 2( 6 ))
11 11 11 11
Entropy = 0.994030211
c. Atribut berat 3:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2
Entropy = 1
2. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( −2 × log 2(2))
6 6 6 6
Entropy = 0.918295834
b. Atribut batuk 2:
Jumlah kasus (S)= 8
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −6 × log 2(6))
8 8 8 8
Entropy = 0.811278124
3. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2
Entropy = 0.979868757
b. Atribut flue 2:
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 5
7
Entropy = 0.979868757
4. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat1:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −6 × log 2( 6 ))
10 10 10 10
Entropy = 0.970950594
b. Atribut nafas berat 2:
Jumlah kasus (S)= 4
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −2 × log 2(2))
4 4 4 4
Entropy = 1
5. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −1 × log 2(1))
2 2 2 2
Entropy = 1
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 5
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−5
Entropy = ( × log 2( 5 )) + ( −7 × log 2( 7 ))
12 12 12 12
Entropy = 0.979868757
6. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
8
Entropy = 0
b. Atribut status gizi 2:
Jumlah kasus (S)= 13
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −6 × log 2( 6 )) + ( −7 × log 2( 7 ))
13 13 13 13
Entropy = 0.995727452
7. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −0 × log 2(0))
2 2 2 2
Entropy = 0
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 12
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 8
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −8 × log 2( 8 ))
12 12 12 12
Entropy = 0.918295834
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – ∑𝑛𝑖=0berat × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
total
1
Gain(total,berat) = 0.985228136 – (( ×0) + (11 ×0.994030211) +
14 14
( 2 ×1)
14
Gain (total,berat) = 0.061347256
2. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛
𝑖=0 total
8
Entropy = 0
b. Atribut berat 2:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −6 × log 2( 6 ))
10 10 10 10
Entropy = 0.970950594
c. Atribut berat 3:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1
Entropy = 0
2. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 5
Jumlah kasus (P/S1)= 3
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−3
Entropy = ( × log 2( 3)) + ( −2 × log 2(2))
5 5 5 5
Entropy = 0.970950594
b. Atribut batuk 2:
8
Entropy = 0.591672779
3. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1
Entropy = 0.945660305
b. Atribut flue 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −7 × log 2( 7 ))
11 11 11 11
Entropy = 0.945660305
4. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat1:
Jumlah kasus (S)= 9
Jumlah kasus (P/S1)= 3
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−3
Entropy = ( × log 2( 3)) + ( −6 × log 2(6))
9 9 9 9
Entropy = 0.918295834
b. Atribut nafas berat 2:
Jumlah kasus (S)= 3
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −2 × log 2(2))
3 3 3 3
Entropy = 0.918295834
8
Entropy = 0
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−4
Entropy = ( × log 2( 4 )) + ( −7 × log 2( 7 ))
11 11 11 11
Entropy = 0.945660305
6. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 0
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −0 × log 2( 0)) + ( −1 × log 2(1))
1 1 1 1
Entropy = 0
b. Atribut status gizi 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4 )) + ( −7 × log 2( 7 ))
11 11 11 11
Entropy = 0.945660305
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – ∑𝑛𝑖=0berat × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
total
1
Gain(total,berat) = 0.918295834 – (( ×0) + (10 ×0.970950594) +
12 12
( ×0)
1
12
Gain (total,berat) = 0.109170339
2. Menghitung nilai gain atribut kelas batuk:
8
Entropy = 0.940285959
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 33
Jumlah kasus (P/S1)= 27
Jumlah kasus (Np/S2)= 6
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−27
Entropy = ( × log 2( 27)) + ( −6 × log 2( 6 ))
33 33 33 33
Entropy = 0.684038436
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 24
Jumlah kasus (P/S1)= 23
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−23
Entropy = ( × log 2( 23)) + ( −1 × log 2( 1 ))
24 24 24 24
Entropy = 0.249882293
2. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 30
Jumlah kasus (P/S1)= 21
Jumlah kasus (Np/S2)= 9
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −21 × log 2( 21)) + ( −9 × log 2( 9 ))
30 30 30 30
Entropy = 0.881290899
b. Atribut berat 2:
Jumlah kasus (S)= 48
Jumlah kasus (P/S1)=
40 Jumlah kasus
Entropy = ∑𝑛
𝑖 − 𝑝𝑖 ∗ log2∗
Entropy = 0.650022422
c. Atribut berat 3:
Jumlah kasus (S)= 7
Jumlah kasus (P/S1)= 7
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −7 × log 2( 7)) + ( −0 × log 2(0))
7 7 7 7
Entropy = 0
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 21
Jumlah kasus (P/S1)= 16
Jumlah kasus (Np/S2)= 5
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −16 × log 2( 16)) + ( −5 × log 2( 5 ))
21 21 21 21
Entropy = 0.791858353
b. Atribut batuk 2:
Jumlah kasus (S)= 64
Jumlah kasus (P/S1)= 52
Jumlah kasus (Np/S2)= 12
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −52 × log 2( 52)) + ( −12 × log 2(12))
64 64 64 64
Entropy = 0.69621226
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 15
Jumlah kasus (P/S1)= 11
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−11
Entropy = ( × log 2( 11)) + ( −4 × log 2( 4 ))
15 15 15 15
Entropy = 0.692419486
b. Atribut flue 2:
Jumlah kasus (S)= 70
Jumlah kasus (P/S1)=
57 Jumlah kasus
Entropy = ∑𝑛
𝑖 − 𝑝𝑖 ∗ log2∗
Entropy = ( −57
7
× log 2( 57
7
)) + ( −13
7
× log 7
8
Entropy = 0.692419486
5. Menghitung nilai entropy atribut kelas nafas berat:
a. Atribut nafas berat 1:
Jumlah kasus (S)= 16
Jumlah kasus (P/S1)= 8
Jumlah kasus (Np/S2)= 8
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −8 × log 2( 8 )) + ( −8 × log 2( 8 ))
16 16 16 16
Entropy = 1
b. Atribut nafas berat 2:
Jumlah kasus (S)= 69
Jumlah kasus (P/S1)= 60
Jumlah kasus (Np/S2)= 9
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −60 × log 2( 60)) + ( −9 × log 2( 9 ))
69 69 69 69
Entropy = 0.558629373
6. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 23
Jumlah kasus (P/S1)= 21
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−21
Entropy = ( × log 2( 21)) + ( −2 × log 2( 2 ))
23 23 23 23
Entropy = 0.426228657
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 62
Jumlah kasus (P/S1)= 47
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−47
Entropy = ( × log 2( 47)) + ( −15 × log 2(15))
62 62 62 62
Entropy = 0.798244134
7. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 8
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
8
Entropy = 0.721928095
c. Atribut status gizi 2:
Jumlah kasus (S)= 75
Jumlah kasus (P/S1)= 60
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −60 × log 2( 60)) + ( −15 × log 2(15))
75 75 75 75
Entropy = 0.721928095
8. Menghitung nilai entropy atribut kelas lingkungan rokok:
a. Atribut lingkungan rokok 1:
Jumlah kasus (S)= 18
Jumlah kasus (P/S1)= 16
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −16 × log 2( 16)) + ( −2 × log 2( 2 ))
18 18 18 18
Entropy = 0.503258335
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 67
Jumlah kasus (P/S1)= 52
Jumlah kasus (Np/S2)= 15
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −52 × log 2( 52)) + ( −15 × log 2(15))
67 67 67 67
Entropy = 0.767190321
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛 umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
𝑖=0 total
Gain(total,umur) = 0.721928095 – ((28 ×0.940285959) +
85
( ×0.684038436) + ( ×0.249882293)
33 24
85 85
Gain (total,umur) = 0.076063974
2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – berat
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
∑𝑛
𝑖=0 total
Gain(total,berat) = 0.721928095 – ((30 ×0.881290899) +
85
(48 ×0.650022422) + ( 7 ×0)
85 85
Gain (total,berat) = 0.043812763
3. Menghitung nilai gain atribut kelas batuk:
9
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.721928095 – ((10 ×0.721928095) +
85
((75 ×0.721928095)
85
Gain (total,status gizi) =0
8. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
∑𝑛
𝑖 total ×
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.721928095 – ((18 ×0.503258335) +
85
(( ×0.767190321)
67
85
Gain (total,tenggorokan merah) = 0.010629254
Perhitungan nood (root) untuk mencari entropy nafas berat 1:
Rumus: Entropy(S) = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Jumlah kasus (S)= 15
Jumlah kasus (P/S1)= 8
Jumlah kasus (Np/S2)= 7
9
Entropy = 0.918295834
b. Atribut umur 2 tahun:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 4
Jumlah kasus (Np/S2)= 2
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −4 × log 2( 4)) + ( 2 × log 2(2))
6 6 6 6
Entropy = 0.918295834
c. Atribut umur 3 tahun:
Jumlah kasus (S)= 3
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 1
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −1 × log 2(1))
3 3 3 3
Entropy = 0.918295834
2. Menghitung nilai entropy atribut kelas berat:
a. Atribut berat 1:
Jumlah kasus (S)= 6
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −4 × log 2(4))
6 6 6 6
Entropy = 0.918295834
b. Atribut berat 2:
9
Entropy = 0.985228136
c. Atribut berat 3:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −0 × log 2(0))
2 2 2 2
Entropy = 0
3. Menghitung nilai entropy atribut kelas batuk:
a. Atribut batuk 1:
Jumlah kasus (S)= 5
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 3
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −2 × log 2( 2)) + ( −3 × log 2(3))
5 5 5 5
Entropy = 0.970950594
b. Atribut batuk 2:
Jumlah kasus (S)= 10
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 4
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −6 × log 2( 6 )) + ( −4 × log 2( 4 ))
10 10 10 10
Entropy = 0.970950594
4. Menghitung nilai entropy atribut kelas flue:
a. Atribut flue 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−1
Entropy = ( × log 2( 1)) + ( −0 × log 2(0))
1 1 1 1
Entropy =
9
b. Atribut flue 2:
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 7
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−7
Entropy = ( × log 2( 7 )) + ( −7 × log 2( 7 ))
14 14 14 14
Entropy = 1
5. Menghitung nilai entropy atribut kelas tenggorokan merah:
a. Atribut tenggorokan merah 1:
Jumlah kasus (S)= 2
Jumlah kasus (P/S1)= 2
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−2
Entropy = ( × log 2( 2)) + ( −0 × log 2(0))
2 2 2 2
Entropy = 0
b. Atribut tenggorokan merah 2:
Jumlah kasus (S)= 13
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −7 × log 2( 7 ))
13 13 13 13
Entropy = 0.995727452
6. Menghitung nilai entropy atribut kelas status gizi:
a. Atribut status gizi 1:
Jumlah kasus (S)= 1
Jumlah kasus (P/S1)= 1
Jumlah kasus (Np/S2)= 0
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
Entropy = ( −1 × log 2( 1)) + ( −0 × log 2(0))
1 1 1 1
Entropy = 0
d. Atribut status gizi 2:
Jumlah kasus (S)= 14
Jumlah kasus (P/S1)= 7
Jumlah kasus (Np/S2)= 7
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−7
Entropy = ( × log 2( 7 )) + ( −7 × log 2( 7 ))
1 1 1 1
Entropy =
9
Entropy = 1
b. Atribut lingkungan rokok 2:
Jumlah kasus (S)= 11
Jumlah kasus (P/S1)= 6
Jumlah kasus (Np/S2)= 5
Entropy = ∑𝑛 − 𝑝𝑖 ∗ log2∗ 𝑝𝑖
𝑖
−6
Entropy = ( × log 2( 6 )) + ( −5 × log 2( 5 ))
11 11 11 11
Entropy = 0.994030211
Menghitung nilai gain pada masing-masing atribut kelas:
1. Menghitung nilai gain atribut kelas umur:
Gain (total,umur) = Entropy (total) – ∑𝑛𝑖=0umur × 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(umur)
total
Gain(total,umur) = 0.996791632 – (( 6 ×0.918295834) + ( 6 ×
15 15
0.918295834) + ( 3 × 0.918295834)
15
Gain (total,umur) = 0.0784958
2. Menghitung nilai gain atribut kelas berat:
Gain (total,berat) = Entropy (total) – berat
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(berat)
∑𝑛
𝑖=0 total
Gain(total,berat) = 0.996791632 – (( 6 ×0.918295834) +
15
( ×0.985228136) + ( ×0)
7 2
15 15
Gain (total,berat) = 0.16970017
3. Menghitung nilai gain atribut kelas batuk:
Gain (total,batuk) = Entropy (total) – batuk
× 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(batuk)
∑𝑛 𝑖=0 total
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(status gizi)
Gain(total,status gizi) = 0.996791632 – (( 1 ×0) + ((14 ×1)
15 15
Gain (total,status gizi) = 0.0634583
7. Menghitung nilai gain atribut kelas lingkungan rokok:
Gain(total,tenggorokan merah) = Entropy (total) – tenggorokan merah
𝑖 total ×
∑𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(tenggorokan merah)
Gain(total,tenggorokan merah) = 0.996791632 – (( 4 ×1) +
15
(( ×0.994030211
11
15
Gain (total,tenggorokan merah) = 0.00116948