TUGAS AKHIR
Diajukan sebagai salah satu syarat
untuk memperoleh gelar Sarjana Komputer
Oleh:
David Tanujaya
NIM.2016420015
David Tanujaya
NIM. 2016420015
Disahkan Oleh:
Pembimbing
Mengetahui:
Penulis
i
Abstrak
Data mining merupakan suatu teknik untuk menggali suatu informasi yang
tersembunyi dari suatu kumpulan data. Metode yang digunakan untuk penelitian
ini yaitu klasifikasi. Metode klasifikasi ini bertujuan untuk mengklasifikasikan
penyakit berdasarkan wilayah yang diperoleh dari data laporan harian kunjungan
pasien. Algoritma yang digunakan adalah algoritma C4.5. Dengan metode dan
algoritma tersebut nantinya akan menghasilkan suatu bentuk pohon keputusan
yang bisa membantu pihak Puskesmas Purwakarta mengambil keputusan yang
tepat sasaran dalam kegiatan penyuluhan penyakit di masyarakat. Pengujian yang
dilakukan dengan membandingkan hasil pohon keputusan yang dihasilkan secara
manual dan aplikasi. Berdasarkan hasil pengujian, aplikasi yang dibangun dapat
membantu pihak Puskesmas Surabaya untuk kegiatan penyuluhan penyakit
kepada masyarakat menjadi tepat sasaran berdasarkan data laporan harian
kunjungan pasien yang telah diolah menggunakan aplikasi.
ii
DAFTAR ISI
KATA PENGANTAR..............................................................................................i
DAFTAR ISI..........................................................................................................iii
DAFTAR TABEL...................................................................................................iv
DAFTAR GAMBAR...............................................................................................v
DAFTAR ISTILAH................................................................................................vi
DAFTAR SINGKATAN.......................................................................................vii
BAB I PENDAHULUAN........................................................................................1
1.1. Latar Belakang..............................................................................................1
1.2. Rumusan Masalah.........................................................................................3
1.3. Batasan Masalah............................................................................................3
1.4. Tujuan............................................................................................................4
1.5. Manfaat..........................................................................................................4
1.6. Metodologi Penelitian...................................................................................4
1.7. Sistematika Penulisan....................................................................................6
DAFTAR PUSTAKA..............................................................................................8
iii
DAFTAR TABEL
iv
DAFTAR GAMBAR
v
DAFTAR ISTILAH
vi
DAFTAR SINGKATAN
vii
BAB I
PENDAHULUAN
penelitian.
karena dengan hidup sehat segala aktifitas dapat dilakukan dengan baik. Sehingga
tidak heran jika seseorang melakukan berbagai cara untuk menjaga kesehatannya.
Namun demikian, bukan tidak mungkin seseorang tersebut dapat terserang suatu
penyakit [1]. Demam merupakan salah satu jenis gangguan kesehatan yang
perlu diwaspadai yaitu Demam Berdarah Dengue, Tifoid, Malaria, Viral, Chicken
Virus) [1].
mengetahui jenis demamnya melalui gejala yang dialami oleh orang tersebut.
Gejala penyakit demam sangat mirip dan sulit dibedakan sehingga seringkali
kecepatan mendiagnosis penyakit sangat terbatas dan terkadang kurang akurat [1].
1
2
Masih banyak dokter internship dan tenaga medis yang sulit dalam mendiagnosis
penyakit ini.
penyakit Demam Berdarah Dengue, Malaria dan Tifoid [1]. Penelitian ini
menggunakan data latih dan data uji yang berjumlah 143 data, telah memberikan
variasi data latih sebesar 86.04% , pengujian rasio data latih dan data uji
didapatkan akurasi sebesar 95% , pengujian variasi jumlah data uji didapatkan
akurasi sebesar 90% , pengujian variasi data uji didapatkan rata-rata akurasi
variable yang paling mempengaruhi penyakit pasien dengan kategori ISPA [2].
Penelitian ini menggunakan hasil data pasien, status imunisasi, jenis kelamin, usia
dan kriteria gizi pada tahun 2012 yaitu sebanyak 200 pasien terkena ISPA, telah
memberikan hasil bahwa jenis kelamin tidak berpengaruh terhadap penyakit ISPA
[2]. Berdasarkan dari kedua penelitian tersebut, perlu adanya uji coba
Tujuan dari penelitian tugas akhir ini adalah memanfaatkan sebuah sistem
sistem pakar. Sistem Pakar adalah sistem yang berusaha mengadopsi pengetahuan
3
penyakit demam jika dilakukan secara manual dikarenakan miripnya gejala yang
ada.
Agar dalam penulisan penelitian Tugas Akhir ini dapat terarah dan
1.4. Tujuan
Tujuan dari Tugas Akhir ini adalah membuat yang memiliki kemampuan
1.5. Manfaat
tersebut. [3]. Tahapan yang dilakukan peneliti dalam penelitian tugas akhir ini
a. Tahap Analisis
Tahap pertama ini yaitu analisis sistem. Tahap ini akan menganalisa sistem
agar bisa dijalankan. Hasil analisa berupa kelebihan dan kekurangan sistem,
digunakan. Tahap ini memakan waktu cukup lama karena akan muncul
e. Tahap Implementasi
SDLC. Pada tahap ini sistem sudah dibuat, diuji coba dan dipastikan sistem
Tahap ini merupakan tahap terakhir dari SDLC untuk memantau dan
6
memastikan sistem berjalan lancer. Pada tahap ini jika ditemukan kerusakan,
g. Sistematika Penulisan
sebagai berikut :
BAB I PENDAHULUAN
Bab ini berisikan latar belakang, rumusan masalah, batasan masalah, tujuan
Bab ini menguraikan tentang teori yang berhubungan dengan judul tugas
akhir, seperti hal-hal yang terkait mengenai penyakit demam dan teori – teori
decision tree.
Bab ini menjelaskan mengenai analisa sistem aplikasi yang dibuat dan
BAB IV IMPLEMENTASI
Bab ini menjelaskan implementasi dari program yang telah dibuat meliputi
BAB V PENUTUP
Bab ini berisi kesimpulan dan saran dari penulis untuk pengembangan sistem
DAFTAR PUSTAKA
Pada bab ini terdapat landasan teori yang digunakan penulis dalam
pembuatan Klasifikasi Penyebab Demam Menggunakan Metode Decision Tree.
Dimana :
S : himpunan kasus
A : atribut
N : jumlah partisi atribut A
\Si\ : jumlah kasus pada partisi ke-i
|Sr | : jumlah kasus dalam S
2.6. Flowchart
Flowchart atau diagram alir merupakan sebuah diagram dengan simbol-simbol
grafis yang menyatakan aliran algoritma atau proses yang menampilkan langkah-
langkah yang disimbolkan dalam bentuk kotak, beserta urutannya dengan
menghubungkan masing masing langkah tersebut menggunakan tanda panah.
Diagram ini bisa memberi solusi selangkah demi selangkah untuk penyelesaian
masalah yang ada di dalam proses atau algoritma tersebut. Dalam pembuatan
flowchart tidak memiliki rumus atau syarat yang bersifat mutlak. Karena
flowchart merupakan gambaran hasil pemikiran dalam menganalisa suatu masalah
dengan komputer. Untuk pengolahan data mining dengan komputer, dapat
dirangkum urutan dasar untuk pemecahan suatu masalah dengan daftar simbol
yang dapat dilihat pada gambar 1, yaitu;
Start
Database Clustering
No
No
Clasified Prediction
Yes
End Association
2.7. Demam
Demam adalah kenaikan suhu tubuh di atas normal yaitu lebih besar dari 37
C pada orang yang istirahat total di tempat tidur sedangkan pada orang dengan
aktivitas sedang, bersuhu di atas 37,2C. Suhu rektal dan vaginal 0,5C lebih
tinggi dari suhu oral. Hilangnya fluktuasi diurnal (terjadi selama siang hari ) yang
normal sering merupakan gejala pertama adanya demam ringan.
Demam terbagi atas beberapa tingkatan :
a. Demam ringan suhu badan berkisar antara 37-38 C
b. Demam sedang suhu badan berkisar antara 38-39 C
c. Demam suhu badan berkisar antara 39-40 C
d. Demam tinggi suhu badan di atas 40C
Kondisi ini muncul ketika suatu area di otak yang disebut hipotalamus
menggeser suhu tubuh ke atas. Ketika ini terjadi, Anda mungkin akan merasa
kedinginan dan menambah lapisan pada baju Anda atau membungkus diri di
bawah selimut. Hal ini menghasilkan suhu tubuh yang tinggi.
Demam berdarah dengue atau DBD merupakan penyakit mudah menular yang
berasal dari gigitan nyamuk Aedes aegypti dan Aedes albopictus. Penyakit ini
disebabkan oleh salah satu dari empat virus dengue.
Dari beberapa resume jurnal pada table 2.1 sudah banyak jurnal yang
menghasilkan data mining, pada penelitian tugas akhir ini aplikasi yang akan
dibuat adalah Klasifikasi Penyebab Demam Menggunakan Metode Decision Tree
dengan sistematis yang berbeda dengan jurnal yang sudah pernah dibuat
sebelumnya. Jurnal-jurnal tersebut akan dijadikan referensi untuk membuat tugas
akhir. Sebagaimana untuk melengkapi kelebihan dan kekurangan dalam
pengerjaan tugas akhir.
BAB III
ANALISIS DAN DESAIN SISTEM
Pada bab ini akan dibahas mengenai analisis dan desain, serta gambaran
keseluruhan dari sistem yang akan dibangun, baik yang berupa modul-modul
perangkat lunak. Dan juga mendeskripsikan tentang metodologi pengembangan
sistem
Mendeskripsikan
Analisa Masalah
Mempelajari
Literatur
Mengumpulkan Data
Analisa
Perancangan Sistem
Implementasi
Melakukan Pengujian
3.3. Prepocessing
Proses ini bertujuan untuk memilih atribut dari suatu data dan membuang
duplikasi data, memperbaiki kesalahan pada data seperti satu atribut tidak terisi
atau kesalahan dalam menulis isi atribut. Berikut merupakan penjelasan pemilihan
atribut dari data laporan harian kunjungan pasien Puskesmas Surabaya.
3.4. Transformation
Yaitu proses mengganti suatu nilai di sebuah atribut dengan nilai baru yang
sesuai untuk proses data mining. Dalam data yang ada di Puskesmas Surabaya
atribut yang ada nilainya sudah sesuai untuk proses data mining. Contohnya
seperti atribut Umur tidak terjadi perubahan dikarenakan nilai dari atribut umur
sudah masuk ke dalam sebuah interval umur, jadi sudah sesuai untuk proses data
mining. Begitu juga dengan atribut Wilayah yang sudah mengelompokan alamat
dari setiap pasien ke dalam wilayah – wilayah tertentu sesuai dengan wilayah
kerja Puskesmas Surabaya.
Setelah perhitungan nilai entropy, selanjutnya adalah perhitungan nilai gain Untuk
atribut Nama Penyakit dan Umur sebagai berikut.
1. Gain Nama Penyakit 1,6358 – (( * 0) + ( * 0) + ( * 0) + ( * 1) + ( * 1,5) + ( *
0) + ( * 0) + ( * 0) + ( * 0,9183) + ( * 1,5305) + ( * 0) + ( * 0) + ( * 0) =
0,8182
2. Gain Umur 1,6358 – (( * 0,9183) + ( * 1) + ( * 1,4591) + ( * 0,9183) + ( * 0)
+ ( * 0,6500) + ( * 0,9183) + ( * 0) + ( * 0) = 0,7385
BAB IV
IMPLEMENTASI DAN PENGUJIAN
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil analisis dan pengujian yang telah dilakukan pada sistem
penerapan Data Mining dengan metode Klasifikasi dan Algoritma C4.5 ini maka
dapat diambil kesimpulan sebagai berikut:
1. Aplikasi yang dibangun dapat membantu pihak Puskesmas Surabaya untuk
kegiatan penyuluhan penyakit kepada masyarakat menjadi tepat sasaran
berdasarkan data laporan harian kunjungan pasien yang telah diolah menggunakan
aplikasi.
2. Informasi yang dihasilkan oleh aplikasi berupa pohon keputusan dan
dapat menjadi bahan pengambilan keputusan pihak Puskesmas Surabaya wilayah
mana yang akan menjadi tempat kegiatan penyuluhan penyakit.
3. Berdasarkan pada rumusan masalah yang diteliti, proses data mining
dengan menggunakan metoda Algoritma C4.5 dalam mengidentifikasi faktor-
faktor penyebab demam maka dapat diambil kesimpulan bahwa metode Algoritma
C4.5 atau pohon keputusan lebih efektif dan fleksibel jika digunakan pada proses
pengklasifikasian.
4. Sistem yang di implementasikan menggunakan salah satu metode data
mining algoritma C4.5 dan telah diuji dengan software data mining Weka Gui
Chooser dalam mengidentifikasi faktor-faktor penyebab demam memiliki hasil
pengklasifikasian sama.
5.2 Saran
Berdasarkan kesimpulan dan hasil pembahasan yang telah diperoleh pada
penelitian. Maka peneliti memberikan saran yang dapat disampaikan antara lain
sebagai berikut :
1. Dapat membuat sistem perbandingan yang lebih baik dan dapat membuat
grafik secara langsung dari hasil yang diperoleh.
2. Dapat melakukan perbandingan metode assosiation rule yang lebih efisien
dibandingkan sebelumnya.
DAFTAR PUSTAKA
[1] E. N. Shofia, R. Regasari, M. Putri, and A. Arwan, “Sistem Pakar Diagnosis
Penyakit Demam : DBD , Malaria dan Tifoid Menggunakan Metode K-Nearest
Neighbor – Certainty Factor,” vol. 1, no. 5, pp. 426–435, 2017.
[2] P. Soepomo, “PENERAPAN DATA MINING UNTUK KLASIFIKASI
PREDIKSI PENYAKIT ISPA ( Infeksi Saluran Pernapasan Akut ) DENGAN
ALGORITMA DECISION TREE ( ID3 ),” vol. 2, pp. 160–168, 2014.
[3] K. E. Kendall and J. E. Kendall, Systems Analys And Design, Sembilan. Pearson,
2014.