Anda di halaman 1dari 36

KLASIFIKASI PENYEBAB DEMAM

MENGGUNAKAN METODE DECISION TREE

TUGAS AKHIR
Diajukan sebagai salah satu syarat
untuk memperoleh gelar Sarjana Komputer

Oleh:
David Tanujaya
NIM.2016420015

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS DR. SOETOMO
SURABAYA
2021
KLASIFIKASI PENYEBAB DEMAM MENGGUNAKAN
METODE DECISION TREE

David Tanujaya
NIM. 2016420015

Disahkan Oleh:

Pembimbing

Yudi Kristyawan, S.Kom., M.Kom.


NPP. 98.01.1.294

Mengetahui:

Dekan Fakultas Teknik Ketua Jurusan Teknik Informatika

Achmad Choiron, S.Kom.,M.T. Edi Prihartono, S.Kom., M.T.


NPP. 97.01.1.266 NPP. 09.01.1.369
KATA PENGANTAR

Berkat rahmat Tuhan Yang Maha Esa, akhirnya penulis dapat


menyelesaikan tugas akhir yang berjudul Klasifikasi Penyebab Demam
Menggunakan Metode Decision Tree, sesuai dengan yang direncanakan.
Atas terselesaikannya tugas akhir ini, penulis menyampaikan banyak
terima kasih kepada :
1. Allah S.W.T yang telah melimpahkan rahmat-Nya, sehingga penulis
dapat menyelesaikan Tugas Akhir ini.
2. Orangtua yang telah memberikan dukungan materil dan imateril,
semangat, dan kasih sayang kepada penulis.
3. Bapak Yudi Kristyawan, S.Kom., M.Kom, sebagai dosen pembimbing
yang telah bersedia meluangkan waktu untuk memberikan saran dan
bimbingannya selama penelitian ini.
4. Seluruh dosen Teknik Informatika, teman-teman seperjuangan, dan
pihak lain yang membantu memberikan dukungan dalam penyelesaian
Tugas Akhir ini.
Semoga dengan terselesaikannya Tugas Akhir dan Laporannya ini dapat
memberikan manfaat bagi penulis dan para pembaca. Penulis menyadari bahwa
ini masih jauh dari kata sempurna, kaena mengingat terbatasnya pengetahuan dan
kemampuan penulis. Oleh karenanya penulis memohon maa dan bila ada kritik
dan saran, penulis akan sangat menerima dengan terbuka.

Surabaya, 15 Maret 2021

Penulis

i
Abstrak

Data mining merupakan suatu teknik untuk menggali suatu informasi yang
tersembunyi dari suatu kumpulan data. Metode yang digunakan untuk penelitian
ini yaitu klasifikasi. Metode klasifikasi ini bertujuan untuk mengklasifikasikan
penyakit berdasarkan wilayah yang diperoleh dari data laporan harian kunjungan
pasien. Algoritma yang digunakan adalah algoritma C4.5. Dengan metode dan
algoritma tersebut nantinya akan menghasilkan suatu bentuk pohon keputusan
yang bisa membantu pihak Puskesmas Purwakarta mengambil keputusan yang
tepat sasaran dalam kegiatan penyuluhan penyakit di masyarakat. Pengujian yang
dilakukan dengan membandingkan hasil pohon keputusan yang dihasilkan secara
manual dan aplikasi. Berdasarkan hasil pengujian, aplikasi yang dibangun dapat
membantu pihak Puskesmas Surabaya untuk kegiatan penyuluhan penyakit
kepada masyarakat menjadi tepat sasaran berdasarkan data laporan harian
kunjungan pasien yang telah diolah menggunakan aplikasi.

ii
DAFTAR ISI

KATA PENGANTAR..............................................................................................i
DAFTAR ISI..........................................................................................................iii
DAFTAR TABEL...................................................................................................iv
DAFTAR GAMBAR...............................................................................................v
DAFTAR ISTILAH................................................................................................vi
DAFTAR SINGKATAN.......................................................................................vii
BAB I PENDAHULUAN........................................................................................1
1.1. Latar Belakang..............................................................................................1
1.2. Rumusan Masalah.........................................................................................3
1.3. Batasan Masalah............................................................................................3
1.4. Tujuan............................................................................................................4
1.5. Manfaat..........................................................................................................4
1.6. Metodologi Penelitian...................................................................................4
1.7. Sistematika Penulisan....................................................................................6
DAFTAR PUSTAKA..............................................................................................8

iii
DAFTAR TABEL

iv
DAFTAR GAMBAR

v
DAFTAR ISTILAH

Suntikan : Jenis suntikan yang tidak masuk ke bawah dermis dan


Intradermal biasanya digunakan untuk vaksinasi.
Lapisan : Lapisan yang mengelilingi mukosa.
Submukosa

vi
DAFTAR SINGKATAN

DBD : Demam Berdarah Dengue


TBC : Tuberkulosis
HIV : Human Immunodeficiency Virus
KDD : Knowledge Discovery In Database
PG : Prostagladin
PGE 2 : Prostaglandin E2
SVM : Support Vector Machine
ISPA : Infeksi Saluran Pernapasan Akut
AUC : Anno Urbis Conditae
SSP : Susunan Saraf Pusat
IL-1 : Interleukin-1
ID3 : Iterative Dichotomiser 3
SQL : Structured Query Language
GUI : Graphical User Interface
PHP : Personal Home Page
SDLC System Development Life Cycle

vii
BAB I

PENDAHULUAN

Bab ini membahas latar belakang, rumusan masalah, batasan masalah,

tujuan, manfaat, metodologi penelitian, sistematika penulisan dan lokasi

penelitian.

1.1. Latar Belakang

Kesehatan merupakan hal yang paling didambakan oleh setiap orang,

karena dengan hidup sehat segala aktifitas dapat dilakukan dengan baik. Sehingga

tidak heran jika seseorang melakukan berbagai cara untuk menjaga kesehatannya.

Namun demikian, bukan tidak mungkin seseorang tersebut dapat terserang suatu

penyakit [1]. Demam merupakan salah satu jenis gangguan kesehatan yang

mengganggu produktivitas setiap orang bahkan dapat menyebabkan kematian dan

masih menjadi permasalahan kesehatan Indonesia. Terdapat 8 jenis demam yang

perlu diwaspadai yaitu Demam Berdarah Dengue, Tifoid, Malaria, Viral, Chicken

Guinea, Meningitis, Infeksi Saluran Kemih dan HIV (Human Immunodeficieny

Virus) [1].

Penyakit demam yang menyerang seseorang, masih perlu ditinjau untuk

mengetahui jenis demamnya melalui gejala yang dialami oleh orang tersebut.

Gejala penyakit demam sangat mirip dan sulit dibedakan sehingga seringkali

terjadi kesalahan dalam mendiagnosis karena keterbatasan pengalaman sehingga

kecepatan mendiagnosis penyakit sangat terbatas dan terkadang kurang akurat [1].

1
2

Masih banyak dokter internship dan tenaga medis yang sulit dalam mendiagnosis

penyakit ini.

Penelitian sebelumnya menggunakan metode K-Nearest Neighbour (KNN)

dan Certainty Factor untuk membantu tenaga medis dalam mendiagnosis

penyakit Demam Berdarah Dengue, Malaria dan Tifoid [1]. Penelitian ini

menggunakan data latih dan data uji yang berjumlah 143 data, telah memberikan

hasil pengujian variasi nilai K didapatkan akurasi sebesar 88.37% , pengujian

variasi data latih sebesar 86.04% , pengujian rasio data latih dan data uji

didapatkan akurasi sebesar 95% , pengujian variasi jumlah data uji didapatkan

akurasi sebesar 90% , pengujian variasi data uji didapatkan rata-rata akurasi

sebesar 97.22%. Pada pengujian perbandingan metode, metode k-nearest

neighbor-certainty factor menghasilkan akurasi sebesar 84.79% [1].

Penelitian selanjutnya menggunakan metode Decision Tree untuk

membentuk suatu model pohon keputusan dalam memprediksi dan melihat

variable yang paling mempengaruhi penyakit pasien dengan kategori ISPA [2].

Penelitian ini menggunakan hasil data pasien, status imunisasi, jenis kelamin, usia

dan kriteria gizi pada tahun 2012 yaitu sebanyak 200 pasien terkena ISPA, telah

memberikan hasil bahwa jenis kelamin tidak berpengaruh terhadap penyakit ISPA

[2]. Berdasarkan dari kedua penelitian tersebut, perlu adanya uji coba

menggunakan penyakit dan metode yang berbeda.

Tujuan dari penelitian tugas akhir ini adalah memanfaatkan sebuah sistem

yang mengadopsi pengetahuan pakar untuk mengatasi masalah tersebut yaitu

sistem pakar. Sistem Pakar adalah sistem yang berusaha mengadopsi pengetahuan
3

para pakar dalam menyelesaikan permasalahan berbasis sistem komputer [1].

Penelitian ini akan menggunakan metode Decision Tree untuk menghasilkan

klasifikasi sehingga menghasilkan suatu diagnosis penyakit demam khususnya

DBD, Malaria, dan tifoid.

Dari pembahasan permasalahan tersebut, maka dalam penelitian proyek

Tugas Akhir dengan judul “KLASIFIKASI PENYEBAB DEMAM

MENGGUNAKAN METODE DECISION TREE” diharapkan dapat

mempermudah tenaga medis, serta penggunaan metode yang mendukung dalam

memberikan informasi untuk menentukan diagnosis penyakit demam, khususnya

DBD, Malaria dan Tifoid.

1.2. Rumusan Masalah

Berdasarkan latar belakang penelitian yang telah dijelaskan diatas maka

permasalahan yang dapat dirumuskan adalah sulitnya menentukan diagnosis

penyakit demam jika dilakukan secara manual dikarenakan miripnya gejala yang

ada.

1.3. Batasan Masalah

Agar dalam penulisan penelitian Tugas Akhir ini dapat terarah dan

terfokuskan serta tidak melebar pembahasan permasalahan diluar sistem ini,

penulis memberikan batasan masalah yaitu :

1. Penelitian ini hanya membahas penyakit DBD, Malaria dan Tifoid.

2. Menggunakan 143 data uji.

3. Menggunakan metode Decision Tree.


4

1.4. Tujuan

Tujuan dari Tugas Akhir ini adalah membuat yang memiliki kemampuan

mengklasifikasikan gejala demam untuk menghasilkan diagnosis pada penyakit

DBD, Malaria dan Tifoid menggunakan Decision Tree.

1.5. Manfaat

Manfaat dari pembuatan Tugas Akhir ini adalah mempermudah atau

membantu tenaga medis mengklasifikasi gejala demam dalam mendiagnosis

penyakit DBD, Malaria dan Tifoid.

1.6. Metodologi Penelitian

Metodologi yang digunakan adalah System Development Life Cycle

(SDLC). SDLC adalah proses pembuatan dan pengubahan sistem dengan

pendekatan bertahap serta model  yang digunakan untuk mengembangkan sistem

tersebut. [3]. Tahapan yang dilakukan peneliti dalam penelitian tugas akhir ini

berdasarkan pada tahap-tahap metode SDLC berikut:

a. Tahap Analisis

Tahap pertama ini yaitu analisis sistem. Tahap ini akan menganalisa sistem

agar bisa dijalankan. Hasil analisa berupa kelebihan dan kekurangan sistem,

fungsi sistem, hingga pembaharuan yang dapat diterapkan.

b. Tahap Desain & Perancangan


5

Tahap perancang dan pengembang akan dimulai dari mendesain software.

Tahapan ini akan menghasilkan prototype dan beberapa output lain meliputi

dokumen berisi desain, pola, dan komponen yang diperlukan untuk

mewujudkan proyek tersebut.

c. Tahap Pembangunan Sistem

Pengembangan sistem ialah tahap di mana rancangan mulai dikerjakan,

dibuat, atau diimplementasikan menjadi sistem yang utuh dan dapat

digunakan. Tahap ini memakan waktu cukup lama karena akan muncul

kendala-kendala baru yang mungkin dapat menghambat jalannya

pengembangan sistem. Pada tahapan ini, perancangan bisa saja berubah

karena satu atau banyak hal.

d. Tahap Pengujian Sistem

Sistem yang telah dikembangkan, selanjutnya harus melalui tahap pengujian

sistem sebelum dapat digunakan atau disebarluaskan. Tahap ini digunakan

untuk mengetahui apakah sistem dapat berjalan lancer atau tidak.

e. Tahap Implementasi

Implementasi dan pemeliharaan akan dikatakan sebagai tahapan terakhir dari

SDLC. Pada tahap ini sistem sudah dibuat, diuji coba dan dipastikan sistem

dapat bekerja dengan optimal.

f. Tahap Pemeliharaan Sistem

Tahap ini merupakan tahap terakhir dari SDLC untuk memantau dan
6

memastikan sistem berjalan lancer. Pada tahap ini jika ditemukan kerusakan,

maka akan segera dilakukan perombakan atau perbaikan sistem.

g. Sistematika Penulisan

Pada penulisan tugas akhir ini, penulis menggunakan sistematika penulisan

sebagai berikut :

BAB I PENDAHULUAN

Bab ini berisikan latar belakang, rumusan masalah, batasan masalah, tujuan

dan manfaat, sistematika penelitian dan sistematika pembahasan laporan.

BAB II LANDASAN TEORI

Bab ini menguraikan tentang teori yang berhubungan dengan judul tugas

akhir, seperti hal-hal yang terkait mengenai penyakit demam dan teori – teori

yang terkait dengan klasifikasi penyebab demam menggunakan metode

decision tree.

BAB III ANALISA DAN DESAIN

Bab ini menjelaskan mengenai analisa sistem aplikasi yang dibuat dan

perancangan desain sistem yang akan dibangun.

BAB IV IMPLEMENTASI

Bab ini menjelaskan implementasi dari program yang telah dibuat meliputi

spesifikasi kebutuhan implementasi, serta ujicoba program dimana untuk


7

menemukan kesalahan-kesalahan dari program yang mungkin terjadi,

sehingga dapat diperbaiki.

BAB V PENUTUP

Bab ini berisi kesimpulan dan saran dari penulis untuk pengembangan sistem

DAFTAR PUSTAKA

Pada bagian ini sumber-sumber literatur yang digunakan akan di tampilkan

pada halaman terakhir dalam pembuatan laporan tugas akhir ini


Bab II
LANDASAN TEORI

Pada bab ini terdapat landasan teori yang digunakan penulis dalam
pembuatan Klasifikasi Penyebab Demam Menggunakan Metode Decision Tree.

2.1. Knowledge Discovery In Database ( KDD )

Knowledge Discovery In Database adalah proses menentukan informasi yang


berguna serta pola-pola yang ada dalam data. Informasi ini terkandung dalam
basis data yang berukuran besar yang sebelumnya tidak diketahui dan potensial
bermanfaat. Di dalam deskripsi sistem terdapat data selection sebagai kumpulan
data, pre-processing yang terdapat proses cleaning data, transformation membahas
tentang proses coding pada data tersebut, data mining membahas tentang metode
dari algoritma, dan interpretation atau evaluation membahas tentang proses
informasi yang dihasilkan dari data mining yang dapat dilihat pada gambar 1.

Gambar. 1 Tahapan Knowledge Discovery In Database


Tahapan Knowledge Discovery In Database:
a. Data Selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan
sebelum tahap penggalian informasi dalam Knowledge Discovery In Database
dimulai. Data hasil seleksi yang digunakan untuk proses data mining, disimpan
dalam suatu berkas, terpisah dari basis data operasional.
b. Pre-processing / cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses
cleaning pada data yang menjadi fokus Knowledge Discovery In Database. Proses
cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data.
c. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data
tersebut sesuai untuk proses data mining. Proses coding dalam Knowledge
Discovery In Database merupakan proses kreatif dan sangat tergantung pada jenis
atau pola informasi yang akan dicari dalam basis data.
d. Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam data
terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau
algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma
yang tepat sangat bergantung pada tujuan dan proses Knowledge Discovery In
Database secara keseluruhan.
e. Interpretation / Evaluation
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan
dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini
merupakan bagian dari proses Knowledge Discovery In Database yang disebut
interpretation. Tahap ini mencakup pemeriksaan apakah pola atau informasi yang
ditemukan bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
2.2. Klasifikasi
Klasifikasi adalah suatu proses pengelompokan data dengan didasarkan pada
ciri-ciri tertentu ke dalam kelas-kelas yang telah ditentukan. Algoritma yang
sering digunakan untuk mengklasifikasikan antara lain seperti: Support Vector
Machine, Naïve Baiyes, Artifical Neuron Network, dan K-Nearest Neighbor.
Untuk dapat mendapatkan hasil klasifikasi, proses yang paling utama yaitu
membuat sebuah model. Model berfungsi untuk menjawab pertanyaan yang
diajukan. Model sendiri dibuat melalui proses latihan. Proses latihan merupakan
proses untuk melatih data yang telah dikumpulkan. Data yang sebelumnya telah
terkumpul dibagi dua dengan perbandingan lebih banyak data digunakan untuk
data latih dan sisanya untuk data uji.

2.3. Decision Tree


Setiap orang tentu menginginkan sebuah pengambilan keputusan yang tepat
dan efisien tak terkecuali sebuah perusahaan. Untuk itu banyak sekali perusahaan
yang membutuhkan suatu media seperti Business Intelligence guna membantu
dalam pengambilan keputusan yang tepat.
Namun, hal tersebut tidak akan berarti tanpa adanya konsep decision tree
(pohon keputusan). Decision tree adalah salah satu metode klasifikasi yang paling
populer, karena mudah untuk diinterpretasi oleh manusia. Decision tree adalah
model prediksi menggunakan struktur pohon atau struktur berhirarki.
Konsep dari pohon keputusan adalah mengubah data menjadi decision tree
dan aturan-aturan keputusan. Manfaat utama dari penggunaan decision tree adalah
kemampuannya untuk mem-break down proses pengambilan keputusan yang
kompleks menjadi lebih simple, sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
Nama lain dari decision tree adalah CART (Classification and Regression
Tree). Dimana metode ini merupakan gabungan dari dua jenis pohon, yaitu
classification tree dan juga regression tree. Untuk memudahkan, berikut ilustrasi
dari keduanya.
Gambar 2. Decision Tree

2.4. Metode Decision Tree


Decision tree juga berguna untuk mengeksplorasi data, menemukan hubungan
tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target.
Decision tree memadukan antara eksplorasi data dan pemodelan, sehingga sangat
bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan
sebagai model akhir dari beberapa teknik lain
Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi adalah
satu-satunya hal yang ditonjolkan dalam metode ini, misalnya sebuah perusahaan
direct mail membuat sebuah model yang akurat untuk memprediksi anggota mana
yang berpotensi untuk merespon permintaan, tanpa memperhatikan bagaimana
atau mengapa model tersebut bekerja.
Kelebihan lain dari metode ini adalah mampu mengeliminasi perhitungan
atau data-data yang kiranya tidak diperlukan. Sebab, sampel yang ada biasanya
hanya diuji berdasarkan kriteria atau kelas tertentu saja.
Meski memiliki banyak kelebihan, namun bukan berarti metode ini tidak
memiliki kekurangan. Decision tree ini bisa terjadi overlap, terutama ketika kelas
dan kriteria yang digunakan sangat banyak tentu saja dapat meningkatkan waktu
pengambilan keputusan sesuai dengan jumlah memori yang dibutuhkan.
Dalam hal akumulasi, decision tree juga seringkali mengalami kendala eror
terutama dalam jumlah besar. Selain itu, terdapat pula kesulitan dalam mendesain
decision tree yang optimal. Apalagi mengingat kualitas keputusan yang
didapatkan dari metode decision tree sangat tergantung pada bagaimana pohon
tersebut di desain.
Terlepas dari kekurangan dan kelebihan dari decision tree, metode ini banyak
digunakan lebih lanjut dalam berbagai pengolahan data. Mulai dari data mining
dan juga machine learning. Dalam dunia kerja, decision tree sendiri sangat
berguna untuk penilaian credit scoring. Jika anda pernah mengajukan kredit yang
diproses secara instan, nah anda sudah mempunyai pengalaman dari decision tree.

2.5. Algoritma C4.5


Algoritma C4.5 adalah algoritma yang sudah banyak dikenal dan digunakan
untuk klasifikasi data yang memiliki atribut-atribut numerik dan kategorial. Hasil
dari proses klasifikasi yang berupa aturan-aturan dapat digunakan untuk
memprediksi nilai atribut bertipe diskret dari record yang baru. Algortima C4.5
sendiri merupakan pengembangan dari algortima ID3, dimana pengembangan
dilakukan dalam hal, bisa mengatasi missing data, bisa mengatasi data kontinu
dan pruning.
Secara umum algoritma C4.5 untuk membangun pohon keputusan adalah
sebagai berikut:
1. Pilih atribut sebagai akar.
2. Buat cabang untuk tiap-tiap nilai.
3. Bagi kasus dalam cabang.
4. Ulangi proses untuk setiap cabang sampai semua
Untuk memilih atribut akar, didasarkan pada nilai gain tertinggi dari atribut-
atribut yang ada. Untuk menghitung gain digunaka rumus seperti yang tertera
dalam persamaan 1 berikut :

Gain (S.A) = Entropy (S) - Zi; =i Entropy (Si)

Dimana :
S : himpunan kasus
A : atribut
N : jumlah partisi atribut A
\Si\ : jumlah kasus pada partisi ke-i
|Sr | : jumlah kasus dalam S

2.6. Flowchart
Flowchart atau diagram alir merupakan sebuah diagram dengan simbol-simbol
grafis yang menyatakan aliran algoritma atau proses yang menampilkan langkah-
langkah yang disimbolkan dalam bentuk kotak, beserta urutannya dengan
menghubungkan masing masing langkah tersebut menggunakan tanda panah.
Diagram ini bisa memberi solusi selangkah demi selangkah untuk penyelesaian
masalah yang ada di dalam proses atau algoritma tersebut. Dalam pembuatan
flowchart tidak memiliki rumus atau syarat yang bersifat mutlak. Karena
flowchart merupakan gambaran hasil pemikiran dalam menganalisa suatu masalah
dengan komputer. Untuk pengolahan data mining dengan komputer, dapat
dirangkum urutan dasar untuk pemecahan suatu masalah dengan daftar simbol
yang dapat dilihat pada gambar 1, yaitu;
Start

Database Clustering

No

Classification Yes Clustered

No

Clasified Prediction
Yes

End Association

2.7. Demam
Demam adalah kenaikan suhu tubuh di atas normal yaitu lebih besar dari 37
C pada orang yang istirahat total di tempat tidur sedangkan pada orang dengan
aktivitas sedang, bersuhu di atas 37,2C. Suhu rektal dan vaginal 0,5C lebih
tinggi dari suhu oral. Hilangnya fluktuasi diurnal (terjadi selama siang hari ) yang
normal sering merupakan gejala pertama adanya demam ringan.
Demam terbagi atas beberapa tingkatan :
a. Demam ringan  suhu badan berkisar antara 37-38 C
b. Demam sedang  suhu badan berkisar antara 38-39 C
c. Demam suhu badan berkisar antara 39-40 C
d. Demam tinggi  suhu badan di atas 40C

Tipe-tipe demam bergantung pada suhu tubuh penderita yang berubah-ubah


setiap hari. Penyakit-penyakit tertentu yang diawali dari demam, dapat
dikarakteristikkan dengan kurva temperatur yang spesifik. Berdasarkan hal di atas
demam dibagi atas delapan tipe:
a. Continued fever (febris continua) : suhu tubuh terus-menerus di atas
normal. Gejala ini ditemukan pada lobar pnemonia, typhus dan lain-lain.
b. Remittent fever ( febris remittens ) : suhu tubuh tiap hari turun naik tanpa
kembali ke normal. Gejala ini ditemukan pada penyakit purulent, kadang-
kadang pada tuberkolosis paru-paru.
c. Intermittent fever ( febris intermittens ) : suhu tubuh tiap hari kembali ke
(bawah ) normal, kemudian naik lagi. Gejala ini ditemukan pada penyakit
malaria
d. Hectic fever ( febris hectica ), memiliki fluktuasi temperature yang jauh
lebih besar daripada remittent fever, mencapai 2C – 4C. Hal ini ditandai
dengan menurunnya temperature dengan cepat ke normal atau di bawah
normal, biasanya disertai dengan pengeluaran keringat yang berlebihan.
Gejala ini ditemukan pada tuberkolosis paru-paru dan sepsis.
e. Recurrent fever (febris recurrens) merupakan demam yang mengambuh.
f. Undulant fever ( febris undulans ), ditandai dengan kenaikan suhu tubuh
secara berangsur yang diikuti dengan penurunan suhu tubuh secara
berangsur pula sampai normal. Gejala ini ditemukan pada penyakit
bruselosis.
g. Irreguler fever (febris irregularis), ditandai dengan variasi diurnal yang
tidak teratur dalam selang waktu yang berbeda. Gejala ini ditemukan pada
demam rematik, disentri, influenza, sepsis, rheumocarditis dan lain-lain.
h. Inverted fever ( febris inversa ), dalam hal ini suhu tubuh pagi hari lebih
tinggi daripada malam hari. Gejala ini ditemukan pada tuberkolosis paru-
paru, sepsis dan bruselosis.

2.8. Penyebab Demam

Kondisi ini muncul ketika suatu area di otak yang disebut hipotalamus
menggeser suhu tubuh ke atas. Ketika ini terjadi, Anda mungkin akan merasa
kedinginan dan menambah lapisan pada baju Anda atau membungkus diri di
bawah selimut. Hal ini menghasilkan suhu tubuh yang tinggi. 

Demam biasanya disebabkan oleh:

a. Infeksi seperti flu, sakit tenggorokan, cacar air atau pneumonia


b. Infeksi pada tulang (osteomielitis), radang usus buntu, infeksi kulit atau
selulitis, dan meningitis
c. Efek samping dari beberapa obat
d. Paparan sinar matahari berlebihan
e. Stroke panas
f. Penyakit rheumatoid, penyakit kronis yang menyebabkan pembengkakan dan
nyeri pada sendi, jaringan di sekitar sendi dan organ lain dalam tubuh manusia
g. Keracunan makanan
h. Gangguan hormon seperti penyakit tiroid yang terlalu aktif
i. Tumbuh gigi pada bayi dan anak-anak kecil.

Penyebab Demam Lain :


Ada beberapa penyebab lain yang mungkin menyebabkan suhu tubuh naik, yaitu:
a. Siklus menstruasi pada wanita. Pada tahap kedua dari siklusnya, suhu tubuh
seorang wanita bisa naik 1 derajat atau lebih. 
b. Aktivitas fisik, emosi kuat, makanan, pakaian berat, suhu ruangan terlalu tinggi
dan kelembapan tinggi juga dapat meningkatkan suhu tubuh.

2.9. Demam Berdarah Dengue ( DBD )

Demam berdarah dengue atau DBD merupakan penyakit mudah menular yang
berasal dari gigitan nyamuk Aedes aegypti dan Aedes albopictus. Penyakit ini
disebabkan oleh salah satu dari empat virus dengue.

Penyebab dan Faktor Risiko Demam Berdarah

Kedua nyamuk penyebab DBD biasanya menginfeksi seseorang di pagi sampai


sore hari menjelang petang. Penularan terjadi saaat nyamuk menggigit dan
menghisap darah seseorang yang sudah terinfeksi virus dengue.

2.10. Jurnal Pendukung


Jurnal pendukung pada penelitian tugas akhir ini tertera pada Tabel 2.1 berikut
Tabel 2.1 Jurnal Pendukung
No Judul Keterangan
1 Sistem Pakar Diagnosis Sebagai penunjang dan bahan referensi
Penyakit Demam: DBD menyelesaikan masalah gejala demam.
Malaria dan Tifoid Sistem pakar ini dibuat menggunakan
Menggunakan Metode K- Bahasa pemrograman PHP dan basis data
Nearest Neighbor-Certainty My SQL sebagai tempat penyimpanan data
Factor.[1] masukkan dan data knowledge.
2 Penerapan Data Mining Hasil pengujian yang telah dicapai adalah
Untuk Klasifikasi Prediksi bagaimana pemrosesan metode decision
Penyakit ISPA ( Infeksi tree dalam menyelesaikan persoalan studi
Saluran Pernapasan Akut ) kasus. Berdasarkan hasil pengujian yang
Dengan Algoritma Decision diperoleh maka dapat dihasilkan sebuah
Tree Iterative Dichotomiser perangkat lunak ( software ) baru tentang
3 (ID3).[2] penerapan data mining untuk klasifikasi
prediksi penyakit ISPA ( infeksi saluran
pernapasan akut ) dengan menggunakan
algoritma decision tree
3 Penerapan Data Mining Berdasarkan hasil analisis dan pengujian
Untuk Mengklasifikasikan yang telah dilakukan pada system
Penyakit Berdasarkan penerapan Data Mining dengan metode
Wilayah Dengan Metode Klasifikasi dan Algoritma C4.5 ini maka
Klasifikasi Dan Algoritma dapat diambil kesimpulan sebagai berikut :
C4.5.[4] Aplikasi yang dibangun dapat membantu
pihak Puskesmas Purwakarta untuk
kegiatan penyuluhan penyakit kepada
masyarakat menjadi tepat sasaran
berdasarkan data laporan harian kunjungan
pasien yang telah diolah menggunakan
aplikasi. Informasi yang dihasilkan oleh
aplikasi berupa pohon keputusan dan dapat
menjadi bahan pengambilan keputusan
pihak Puskesmas Purwakarta wilayah
mana yang akan menjadi tempat kegiatan
penyuluhan penyakit.
4 Pola Penggunaan Dari hasil penelitian yang telah dilakukan
Antibiotika Pada Pasien penderita demam tifoid pada dewasa
Dewasa Dengan Demam paling sering terjadi pada jenis kelamin
Tifoid Di RSUP laki-laki dibandingkan perempuan,
SANGLAH Denpasar terbanyak pada usia 18 sampai 34 tahun
Tahun 2016-2017.[5] dan jenis antibiotika yang paling sering
digunakan adalah jenis levofloxacin dari
golongan fluorokuinolon dengan
pemberian terbanyak secara intravena
selama 3-7 hari.

Dari beberapa resume jurnal pada table 2.1 sudah banyak jurnal yang
menghasilkan data mining, pada penelitian tugas akhir ini aplikasi yang akan
dibuat adalah Klasifikasi Penyebab Demam Menggunakan Metode Decision Tree
dengan sistematis yang berbeda dengan jurnal yang sudah pernah dibuat
sebelumnya. Jurnal-jurnal tersebut akan dijadikan referensi untuk membuat tugas
akhir. Sebagaimana untuk melengkapi kelebihan dan kekurangan dalam
pengerjaan tugas akhir.

BAB III
ANALISIS DAN DESAIN SISTEM

Pada bab ini akan dibahas mengenai analisis dan desain, serta gambaran
keseluruhan dari sistem yang akan dibangun, baik yang berupa modul-modul
perangkat lunak. Dan juga mendeskripsikan tentang metodologi pengembangan
sistem

3.1. Deskripsi Sistem


Sistem yang akan dibangun dalam penelitian ini berupa klasifikasi penyebab
demam menggunakan metode decision tree untuk mem-break down proses
pengambilan keputusan yang kompleks menjadi lebih simple, sehingga pengambil
keputusan akan lebih menginterpretasikan solusi dari permasalahan. Karena data
mining adalah suatu rangkaian proses yang dapat dibagi menjadi beberapa tahap.
Tahap-tahap tersebut bersifat interaktif di mana pemakai terlibat langsung atau
dengan perantaraan knowledge base
3.2. Metodologi
Metodologi penelitian ini dilakukan secara sistematik yang dapat digunakan
sebagai pedoman untuk peneliti dalam melaksanakan penelitian agar hasil yang
dicapai tidak menyimpang dan tujuan yang diinginkan dapat terlaksana dengan
baik dan sesuai dengan tujuan yang telah ditetapkan sebelumnya, dengan
kerangka kerja sebagai berikut :

Mendeskripsikan

Analisa Masalah

Mempelajari
Literatur

Mengumpulkan Data

Analisa

Perancangan Sistem

Implementasi
Melakukan Pengujian

Gambar 3.1 Metode Penelitian

3.3. Prepocessing
Proses ini bertujuan untuk memilih atribut dari suatu data dan membuang
duplikasi data, memperbaiki kesalahan pada data seperti satu atribut tidak terisi
atau kesalahan dalam menulis isi atribut. Berikut merupakan penjelasan pemilihan
atribut dari data laporan harian kunjungan pasien Puskesmas Surabaya.

Nama Atribut Keterangan


Nama Penyakit Atribut nama penyakit menjelaskan tentang nama penyakit yang
diderita oleh masyarakat
Umur Atribut ini dipilih karena bisa menjelaskan bagaimana
membedakan penanganan terhadap pasien, seperti pemberian
obat terhadap pasien anak – anak dan dewasa yang mempunyai
dosis yang berbeda
Wilayah Atribut wilayah merupakan atribut penentu keputusan kegiatan
sosialisasi Puskesmas Surabaya yang menunjukan penyakit apa
yang terdapat di Wilayah kerja Puskesmas Surabaya yang terdiri
dari Jawa Timur dan NTT
Jenis Kelamin Atribut jenis kelamin menjelaskan tentang laki-laki atau
perempuan
Jumlah Kasus Atribut Jumlah Kasus menjelaskan berapa jumlah orang
yang terkena kasus penyakit.

Tabel 3.1 Tabel Pemilihan Atribut

3.4. Transformation
Yaitu proses mengganti suatu nilai di sebuah atribut dengan nilai baru yang
sesuai untuk proses data mining. Dalam data yang ada di Puskesmas Surabaya
atribut yang ada nilainya sudah sesuai untuk proses data mining. Contohnya
seperti atribut Umur tidak terjadi perubahan dikarenakan nilai dari atribut umur
sudah masuk ke dalam sebuah interval umur, jadi sudah sesuai untuk proses data
mining. Begitu juga dengan atribut Wilayah yang sudah mengelompokan alamat
dari setiap pasien ke dalam wilayah – wilayah tertentu sesuai dengan wilayah
kerja Puskesmas Surabaya.

Nama Penyakit Umur Wilayah Jenis Kelamin Jumlah Kasus


Tuberkolosis 5-9 tahun NTT Laki-Laki 3
Tuberkolosis 5-9 tahun NTT Laki-Laki 2
ISPA 1-4 tahun NTT Laki-Laki 9
ISPA 1-4 tahun NTT Laki-Laki 5
Dispepesia 20-44 tahun NTT Laki-Laki 2
Dispepesia 45-55 tahun NTT Laki-Laki 4
Gangguan Saraf 10-14 tahun NTT Perempuan 3
ISPA 10-14 tahun NTT Perempuan 1
Tukak Lambung 20-44 tahun NTT Laki-Laki 6
ISPA 15-19 tahun NTT Laki-Laki 9
Diabetes Melitus 56-59 tahun NTT Perempuan 7
Diabetes Melitus 60-69 tahun NTT Laki-Laki 4
Hipertensi Primer 20-44 tahun NTT Laki-Laki 2
Hipertensi Primer 20-44 tahun NTT Laki-Laki 4
Gangguan Kulit 20-44 tahun NTT Laki-laki 5
Cacar Air 20-44 tahun NTT Perempuan 3
Flu 45-55 tahun Jawa Timur Laki-Laki 2
Flu 29 hari - 1 tahun Jawa Timur Perempuan 1
Pneumonia 29 hari - 1 tahun Jawa Timur Perempuan 4
ISPA 1-4 tahun Jawa Timur Perempuan 1
ISPA 1-4 tahun Jawa Timur Perempuan 3
Batuk 5-9 tahun Jawa Timur Perempuan 3
Batuk 5-9 tahun Jawa Timur Laki-Laki 6
Batuk 10-14 tahun Jawa Timur Laki-Laki 7
Demam Tifoid 1-4 tahun Jawa Timur Perempuan 3
Demam Tifoid 5-9 tahun Jawa Timur Perempuan 7
Hipertensi Primer 45-55 tahun Jawa Timur Perempuan 8
Demam Berdarah 29 hari - 1 tahun Jawa Timur Laki-Laki 2

Tabel 3.2 Tabel Kasus


3.5. Data Mining
Yaitu proses mencari informasi berupa klasifikasi penyakit berdasarkan
wilayah dengan bentuk decision tree atau pohon keputusan. Sebelum membentuk
pohon keputusan, data dari tabel di atas diolah terlebih dahulu menggunakan
algoritma C4.5 dengan menghitung entropy dan memilih sebuah atribut sebagai
akar didasarkan pada nilai gain tertinggi. Berikut merupakan proses perhitungan
untuk nilai entropy.
Entropy total = (( * log2 ( )) + (( * log2( )) + (( * log2( )) + (( * log2( )) = 1,6358
Atribut Nama Penyakit
a. Entropy Cacar Air = (( * log2( )) = 0
b. Entropy Common Cold = (( * log2( )) = 0
c. Entropy Demam Tifoid = (( * log2( )) = 0
d. Entropy Diabetes Melitus = (( * log2( )) + (( * log2( )) = 1
e. Entropy Diare = (( * log2( )) + (( * log2( )) + (( * log2( )) = 1,5
f. Entropy Dispepsia = (( * log2( )) = 0
g. Entropy Gangguan Kulit = (( * log2( )) = 0
h. Entropy Gangguan Saraf = (( * log2( )) = 0
i. Entropy Hipertensi Primer = (( * log2( )) + (( * log2( )) = 0,9183
j. Entropy ISPA = (( * log2( )) + (( * log2( )) + (( * log2( )) = 1,5305
k. Entropy Pneumonia = (( * log2( )) = 0
l. Entropy Tuberkolosis = (( * log2( )) = 0
m. Entropy Tukak Lambung = (( * log2( )) = 0 2. Atribut Umur
n. Entropy 29 hari – 1 tahun = (( * log2( )) + (( * log2( )) = 0,9183
o. Entropy 1 – 4 tahun = (( * log2( )) + (( * log2( )) = 1
p. Entropy 5 – 9 tahun = (( * log2( )) + (( * log2( )) + (( * log2( )) = 1,4591
q. Entropy 10 – 14 tahun = (( * log2( )) + (( * log2( )) = 0,9183
r. Entropy 15 – 19 tahun = (( * log2( )) = 0
s. Entropy 20 – 44 tahun = (( * log2( )) + (( * log2( )) = 0,6500
t. Entropy 45 – 55 tahun = (( * log2( )) + (( * log2( )) = 0,9183
u. Entropy 56 – 59 tahun = (( * log2( )) = 0
v. Entropy 60 – 69 tahun = (( * log2( )) = 0

Setelah perhitungan nilai entropy, selanjutnya adalah perhitungan nilai gain Untuk
atribut Nama Penyakit dan Umur sebagai berikut.
1. Gain Nama Penyakit 1,6358 – (( * 0) + ( * 0) + ( * 0) + ( * 1) + ( * 1,5) + ( *
0) + ( * 0) + ( * 0) + ( * 0,9183) + ( * 1,5305) + ( * 0) + ( * 0) + ( * 0) =
0,8182
2. Gain Umur 1,6358 – (( * 0,9183) + ( * 1) + ( * 1,4591) + ( * 0,9183) + ( * 0)
+ ( * 0,6500) + ( * 0,9183) + ( * 0) + ( * 0) = 0,7385

BAB IV
IMPLEMENTASI DAN PENGUJIAN
BAB V
PENUTUP

5.1 Kesimpulan
Berdasarkan hasil analisis dan pengujian yang telah dilakukan pada sistem
penerapan Data Mining dengan metode Klasifikasi dan Algoritma C4.5 ini maka
dapat diambil kesimpulan sebagai berikut:
1. Aplikasi yang dibangun dapat membantu pihak Puskesmas Surabaya untuk
kegiatan penyuluhan penyakit kepada masyarakat menjadi tepat sasaran
berdasarkan data laporan harian kunjungan pasien yang telah diolah menggunakan
aplikasi.
2. Informasi yang dihasilkan oleh aplikasi berupa pohon keputusan dan
dapat menjadi bahan pengambilan keputusan pihak Puskesmas Surabaya wilayah
mana yang akan menjadi tempat kegiatan penyuluhan penyakit.
3. Berdasarkan pada rumusan masalah yang diteliti, proses data mining
dengan menggunakan metoda Algoritma C4.5 dalam mengidentifikasi faktor-
faktor penyebab demam maka dapat diambil kesimpulan bahwa metode Algoritma
C4.5 atau pohon keputusan lebih efektif dan fleksibel jika digunakan pada proses
pengklasifikasian.
4. Sistem yang di implementasikan menggunakan salah satu metode data
mining algoritma C4.5 dan telah diuji dengan software data mining Weka Gui
Chooser dalam mengidentifikasi faktor-faktor penyebab demam memiliki hasil
pengklasifikasian sama.

5.2 Saran
Berdasarkan kesimpulan dan hasil pembahasan yang telah diperoleh pada
penelitian. Maka peneliti memberikan saran yang dapat disampaikan antara lain
sebagai berikut :
1. Dapat membuat sistem perbandingan yang lebih baik dan dapat membuat
grafik secara langsung dari hasil yang diperoleh.
2. Dapat melakukan perbandingan metode assosiation rule yang lebih efisien
dibandingkan sebelumnya.
DAFTAR PUSTAKA
[1] E. N. Shofia, R. Regasari, M. Putri, and A. Arwan, “Sistem Pakar Diagnosis
Penyakit Demam : DBD , Malaria dan Tifoid Menggunakan Metode K-Nearest
Neighbor – Certainty Factor,” vol. 1, no. 5, pp. 426–435, 2017.
[2] P. Soepomo, “PENERAPAN DATA MINING UNTUK KLASIFIKASI
PREDIKSI PENYAKIT ISPA ( Infeksi Saluran Pernapasan Akut ) DENGAN
ALGORITMA DECISION TREE ( ID3 ),” vol. 2, pp. 160–168, 2014.
[3] K. E. Kendall and J. E. Kendall, Systems Analys And Design, Sembilan. Pearson,
2014.

Anda mungkin juga menyukai