308-Article Text-377-1-10-20181116

PERBANDINGAN AKURASI ALGORITMA C4.
5 DAN NAÏVE BAYES

UNTUK DETEKSI DINI GANGGUAN AUTISME PADA ANAK
Bayu Sugara1, Dedi Adidarma2, Sularso Budilaksono3

1,2,3
Program Studi Magister Ilmu Komputer, STMIK Nusa Mandiri Jakarta
Jalan Kramat Raya No.18, Jakarta Pusat 10420
Telp. (021) 31908575
email: bayusugaraa@gmail.com1, dediaridarma8@gmail.com2, sularso@upi-yai.co.id3
ABSTRAK
Deteksi dini gangguan autisme merupakan hal yang terpenting dalam proses tumbuh kembang anak.
Namun, kebanyakan orang tua masih belum memahami tentang gangguan autisme yang dialami oleh anaknya
dan bagaimana cara penanganannya. Para orang tua lebih memilih untuk mencari dan mendatangi seorang dokter
atau pakar tumbuh kembang anak untuk berkonsultasi. Tetapi, ketersediaan dokter ataupun pakar tumbuh
kembang anak sekarang tidaklah terlalu banyak sehingga para orang tua harus mengeluarkan biaya yang relatif
banyak hanya untuk berkonsultasi kepada seorang dokter ataupun pakar. Oleh karena itu diperlukan cara atau
metode untuk memudahkan para orang tua dalam mendeteksi dini gangguan autisme yang dialami oleh anaknya.
Perbandingan kinerja Algoritma C4.5 dan Naïve Bayes bertujuan untuk mengukur tingkat akurasi terbaik dari
masing-masing algoritma untuk diterapkan dalam deteksi dini gangguan autisme pada anak. Hasil dari
komparasi Algoritma C4.5 dan Naïve Bayes menunjukkan bahwa dengan menggunakan Algoritma C4.5
menghasilkan nilai akurasi sebesar 72% sedangkan menggunakan Algoritma Naïve Bayes menunjukan hasil
73.33%.
Kata Kunci: Gangguan Autisme, Data Mining, Algoritma C4.5, Algoritma Naive Bayes, Tingkat Akurasi
ABSTRACT
Early detection of autism disorders is the most important thing in the process of child development.
However, most parents still do not understand about autism disorders experienced by their children and how to
handle them. Parents prefer to look for and visit a doctor or child development expert to consult. However, the
availability of doctors or child development experts now is not too much so that parents have to spend relatively
a lot of money just to consult a doctor or expert. Therefore, a method or method is needed to make it easier for
parents to detect early autism disorders experienced by their children. The performance comparison of
Algorithms C4.5 and Naïve Bayes aims to measure the best level of accuracy of each algorithm to be applied in
the early detection of autism disorders in children. The results of the comparison of the Algorithms C4.5 and
Naïve Bayes show that using the C4.5 Algorithm produces an accuracy value of 72% while using the Naïve
Bayes Algorithm shows 73.33%.
Keywords: Autism Disorder, Data Mining, C4.5 Algorithm, Naive Bayes Algorithm, Accuracy Level
1. PENDAHULUAN oleh anaknya dan bagaimana cara penanganannya.

Para orang tua lebih memilih mencari seorang
1.1. Latar Belakang seorang dokter ataupun datang langsung ke rumah
Deteksi dini gangguan autisme merupakan hal sakit hanya untuk berkonsultasi. Tetapi, ketersediaan
yang terpenting dalam proses tumbuh kembang dokter dalam bidang tumbuh kembang anak
anak. Namun, kebanyakan orang tua masih belum sekarang tidaklah terlalu banyak sehingga para
memahami tentang gangguan autisme yang dialami orang tua harus mengeluarkan biaya yang relatif
Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316 119

besar hanya untuk berkonsultasi kepada seorang dengan metode algoritma C4.5 dan Naïve Bayes ini
dokter. digunakan dalam penelitian pendeteksian dini
gangguan autisme.
Seiring dengan berkembangnya teknologi saat
ini, terutama dalam penggunaan internet. Internet Hasil dari metode algoritma C4.5 dan Naïve
sudah tidak bisa lagi dipisahkan dengan kehidupan Bayes serta klasifikasi yang digunakan dalam
masyarakat saat ini. Masyarakat dapat dengan penelitian ini menunjukkan dengan menggunakan
mudahnya mengakses internet dimanapun dan Algoritma C4.5 menghasilkan nilai akurasi sebesar
kapanpun. Hal ini mendorong para seorang dokter 72% sedangkan menggunakan Algoritma Naïve
untuk mengembangkan internet guna mendukung Bayes menunjukkan nilai akurasi sebesar 73.33%.
dan mempermudah pekerjaan mereka, khususnya Penelitian ini membuat para orang tua dapat dengan
dalam mendiagnosa/mendeteksi suatu penyakit. mudahnya melakukan pendeteksian gangguan
Berdasarkan penelitian sebelumnya yang autisme pada anaknya dengan pengetahuan yang
menggunakan algoritma C4.5 dan Naïve Bayes diberikan berdasarkan gejala-gejala yang dialaminya
untuk mendeteksi suatu penyakit menghasilkan nilai dan dengan cepat bagaimana menangani gangguan
akurasi yang tinggi, maka teknik data mining autisme yang dialami oleh anaknya.
1.2. Rumusan Masalah Wawancara dilakukan kepada para pakar/dokter

Berdasarkan latar belakang yang sudah yang ahli dalam bidang autisme dan/atau
dijelaskan diatas, rumusan masalah dalam penelitian perkembangan anak guna mendapatkan
ini adalah sebagai berikut: informasi mengenai gangguan dan gejala-gejala
a. Bagaimana memberi pengetahuan terhadap autisme.
para orang tua mengenai gangguan autisme c. Studi Pustaka
dan mempermudah para orang tua mendeteksi Studi Pustaka ini dilakukan cara pengumpulan
gangguan autism berdasarkan gejala-gejala data atau informasi yang berkaitan dengan
yang dialami oleh anaknya. penelitian ini maupun penelitian sebelumnya.
b. Bagaimana memanfaatkan teknik data mining Metode ini bersumber dari jurnal-jurnal
dengan menggunakan algoritma C4.5 dan penelitian sebelumnya, paper, artikel, buku serta
Naïve Bayes untuk mendeteksi dini gangguan mencari referensi materi pendukung lainnya
autisme. menggunakan internet.
d. Kuesioner
1.3. Tujuan Penelitian ini juga dilakukan dengan cara
Adapun tujuan dicapai dalam penelitian membuat kuesioner yang dibagikan kepada 50
pendeteksian dini gangguan autisme pada anak ini Orang tua. Kuesioner ini bertujuan untuk
adalah sebagai berikut: mengetahui gangguan autisme yang dialami
a. Memberikan pengetahuan kepada orang tua oleh anaknya dengan mengisi kuesioner yang
mengenai gangguan autisme. telah disediakan.
b. Mengimplementasikan Algoritma C4.5 dan
Naïve Bayes untuk mendeteksi dini gangguan 3. LANDASAN TEORI
autisme dengan berdasarkan gejala-gejala
yang dialami. Dalam penelitian ini, menggunakan tinjauan
c. Membandingkan nilai akurasi dari Algoritma pustaka didasarkan pada beberapa jurnal dan paper.
C4.5 dan Naïve Bayes. Diantaranya sebagai berikut:
2. METODOLOGI 3.1.1. Penelitian Terdahulu

Dalam penelitian yang dilakukan oleh
Metode penelitian yang digunakan dalam Rahmawati yang berjudul Analisa Komparasi
penelitian ini adalah metode pengumpulan data. Algoritma Naïve Bayes dan C4.5 Untuk Prediksi
Metode pengumpulan data dapat dijelaskan sebagai Penyakit Liver mengemukakan bahwa penelitian
berikut: yang dilakukan pembuatan model menggunakan
a. Observasi/Pengamatan algoritma Naïve bayes dan C4.5 menggunakan data
Observasi adalah suatu cara pengumpulan data pasien penderita Liver. Model yang dihasilkan,
dengan pengamatan langsung dan pencatatan dikomparasi untuk mengetahui algoritma yang
secara sistematis terhadap objek yang akan paling baik dalam penentuan identifikasifikasi
diteliti. Observasi dilakukan dalam penelitian penyakit Liver. Untuk mengukur kinerja kedua
ini dengan cara mendatangi langsung lokasi algoritma tersebut digunakan metode pengujian
lembaga yang menangani anak berkebutuhan Cross Validation dan Split Percentace, dan
khusus atau autisme yang terletak di Bekasi. pengukuranya dengan menggunakan confusion
b. Wawancara matrix. Dengan demikian algoritma C4.5 dapat
120 Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316

memberikan pemecahan untuk permasalahandalam untuk mengetahui pola universal dari data-data yang
mengidentifikasi penyakit Liver. (Rahmawati, 2015). ada. Dalam menghasilkan suatu knowledge dari pola
yang ada, diperlukan penerapan metode scientific
Sedangkan pada penelitian dikemukan bahwa yang disebut dengan Knowledge Discovery in
Penggunaan Metode Business Intelligence
diterapkan dalam melakukan pendeteksian dini
untuk mengenali anak berkebutuhan khusus. Dengan
metode klasifikasi, atribut yang paling berpengaruh
berhasil diperoleh, yaitu kemampuan belajar. Dan
hasil perbandingan untuk kedua algoritma C4.5 dan
Naïve Bayes menunjukkan kedua algoritma sama-
sama memberikan hasil yang sangat baik/ tidak ada
perbedaan yang signifikan. (Grand dan Richardus,
Database (KDD). (Jayawardanu dan Hansun,
2017).
2015:2).
Jayawardanu dan Hansun mengemukakan
Gambar 1. Tahapan proses KDD
pendapat bahwa hal yang dilakukan untuk
(Jayawardanu dan Hansun, 2015)
meminimalisir ketidaktahuan tersebut adalah dengan
membangun sebuah sistem yang dapat mendeteksi
Terdapat 5 (lima) Tahapan pada proses
katarak secara dini tanpa harus mengunjungi klinik
Knowledge Discovery in Database (KDD) dapat
mata. Sistem ini dibangun berbasiskan website,
dijelaskan sebagai berikut:
dengan mengimplementasikan metode learning
1. Selection
decision tree dengan algoritma C4.5. Algoritma
Pertama, lakukan seleksi data dari multiple data
C4.5 dipilih karena dinyatakan sebagai algoritma
source dengan membersihkan data yang
learning yang memiliki tingkat keakurasian paling
memiliki noise ataupun missing value.
tinggi.
2. Preprocessing
Kedua, lakukan penggabungan terhadap seluruh
3.1.2. Autisme
data source yang telah terkumpul sebelum
Menurut pendapat Tutik dkk (2009), Autisme
tahapan dari proses selanjutnya dilanjutkan.
merupakan gangguan perkembangan mental pada
3. Transformation
anak yang menyebabkan seorang anak sulit untuk
Ketiga, lakukan transformasi data ke dalam
berinteraksi sosial. Diagnosa autisme biasanya
bentuk yang lebih sesuai untuk dilakukan data
dilakukan oleh seorang pakar/ahli dibidang tumbuh
mining.
kembang anak. Namun sebenarnya, orang tua juga
4. Data Mining
dapat melakukan pengamatan perilaku anak dalam
Keempat, terapkan metode data mining pada
kesehariannya terutama dari cara berkomunikasi,
sistem, sehingga dapat menghasilkan pola dari
berinteraksi sosial dengan anak sebayanya dan
data yang terkumpul.
kemampuan berimajinasi pada anak.
5. Interpretation/Evaluation
Kelima, lakukan interpretasi dan evaluasi dari
3.1.3. Data Mining
pola yang didapatkan, sehingga dapat
Data mining adalah proses menemukan
diidentifikasi apakah pola tersebut sudah dapat
pengetahuan yang menarik, seperti asosiasi, pola,
mewakili knowledge yang ingin dicapai.
perubahan, struktur yang signifikan dan anomali,
dari sejumlah besar data yang disimpan dalam
Dalam proses KDD, metode data mining
database atau gudang data atau repositori informasi
tersebut untuk mengekstraksi pola dari data. Pola itu
lainnya. Telah banyak digunakan dalam beberapa
bisa jadi ditemukan tergantung pada tugas data
tahun terakhir karena ketersediaan data dalam
mining yang diterapkan. Umumnya ada dua jenis
jumlah besar dalam bentuk elektronik, dan ada
tugas penambangan data yaitu Tugas penambangan
kebutuhan untuk mengubah data tersebut menjadi
data deskriptif yang menggambarkan umum sifat
informasi yang berguna dan pengetahuan untuk
data yang ada, dan data mining yang prediktif tugas
aplikasi yang besar. Aplikasi ini ditemukan di
yang berusaha melakukan prediksi berdasarkan data
bidang-bidang seperti Artificial Intelligence,
yang ada. Data mining dapat dilakukan pada data
Machine Learning, Analisis Pasar, Statistik dan
yang bersifat kuantitatif, tekstual, atau multimedia.
Sistem Database, Manajemen Bisnis dan Pendukung
Keputusan.
Aplikasi data mining bisa menggunakan jenis
yang berbeda parameter untuk memeriksa data.
Data mining adalah proses mempekerjakan
Mereka termasuk asosiasi (pola dimana satu acara
satu atau lebih teknik machine learning untuk
terhubung ke acara lain), analisis urutan atau jalur
menganalisis dan mengekstraksi knowledge secara
(pola di mana satu peristiwa mengarah ke acara
otomatis. Penggunaan data mining memiliki tujuan

lain), klasifikasi (identifikasi pola baru dengan target 3.1.4. Algoritma C4.5
yang telah ditetapkan) dan pengelompokan Algoritma C4.5 adalah program yang
(pengelompokkan benda identik atau sejenis). memberi kontribusi satu set data berlabel dan
menghasilkan pohon keputusan sebagai keluaran.
Penambangan data dalam data mining dapat Pohon keputusan tindak lanjut ini kemudian
melibatkan beberapa langkah-langkah kunci yang diverifikasi terhadap data uji berlabel yang tidak
akan dijelaskan sebagai berikut: terlihat untuk menghitung generalisasinya. C4.5
1. Problem definition adalah program yang digunakan untuk menghasilkan
Langkah pertama adalah mengidentifikasi peraturan taksonomi dengan menggunakan pohon
tujuan. Berdasarkan tujuan yang telah keputusan dari sekumpulan data yang diberikan.
ditetapkan, rangkaian alat yang benar bisa jadi
diterapkan pada data untuk membangun Algoritma C4.5 merupakan perpanjangan
perilaku yang sesuai model. dari algoritma ID3 dasar dan dirancang oleh
2. Data exploration Quinlan. C4.5 adalah salah satu algoritma
Jika kualitas data tidak sesuai untuk model yang pembelajaran yang banyak digunakan. Algoritma
akurat maka rekomendasi pada data masa C4.5 membangun pohon keputusan dari serangkaian
depan. Strategi pengumpulan dan penyimpanan data pelatihan yang mirip dengan Algoritma ID3,
bisa dilakukan pada saat ini. Untuk analisis, dengan menggunakan konsep entropi informasi.
semua data perlu dikonsolidasikan sehingga C4.5 juga dikenal sebagai klasifikasi statistik.
bisa jadi diperlakukan secara konsisten. (Manikantan dan Latha, 2013:2).
3. Data preparation
Tujuan dari langkah ini adalah untuk Algoritma ini dapat menyelesaikan masalah
membersihkan dan ubah data sehingga hilang secara sistematis dengan membentuk suatu decision
dan nilai yang tidak valid diperlakukan dan tree dengan langkah-langkah sebagai berikut:
semua nilai valid yang diketahui dibuat 1. Pilih atribut sebagai akar.
konsisten untuk analisis yang lebih kuat. 2. Buat cabang untuk masing-masing record dari
4. Modeling atribut.
Berdasarkan data dan yang diinginkan hasil, 3. Membagi kasus ke dalam cabang,
algoritma data mining atau kombinasi 4. Ulangi proses untuk masing-masing cabang
Algoritma dipilih untuk analisis. Algoritma ini sampai semua kasus pada cabang menghasilkan
termasuk teknik klasik seperti statistik, suatu keputusan yang sesuai.
lingkungan dan clustering tapi juga generasi
penerus teknik seperti pohon keputusan, Dalam memilih sebuah atribut menjadi akar,
jaringan dan algoritma berbasis aturan. dilakukan perhitungan nilai dari atribut yang ada.
Algoritma spesifik dipilih berdasarkan tujuan Nilai gain yang paling tinggi dijadikan root pada
tertentu yang ingin dicapai dan kualitas data pohon keputusan. Untuk menghitung nilai gain
yang akan dianalisis. digunakan rumus:
n | Si |
5. Evaluation and Deployment Gain( S , A) = Entropy ( S ) − ∑ x Entropy (Si)
Berdasarkan hasil algoritma data mining, i =0 | S |
analisis dilakukan terhadap tentukan kesimpulan (1)
utama dari analisis dan buat serangkaian
rekomendasi untuk dipertimbangkan. Keterangan:
S : Himpunan kasus,
A : Atribut,
n : Jumlah partisi dalam atribut,
|Si| : Jumlah kasus pada partisi ke-i,
|S| : Jumlah kasus
Sedangkan untuk perhitungan nilai entropy dapat

dilakukan dengan rumus:
n
Entropy ( S ) = ∑ − Pi * log 2 Pi (2)
i =0
Keterangan:
Gambar 2. Representasi proses data mining S : Himpunan kasus,
(Krishnaiah, Narmisha dan Chandra, 2013) n : Jumlah partisi dalam atribut,

pi : Proposi dari Si terhadap S pohon dibangun, itu diterapkan pada masing-masing
tupel di database dan hasilkan klasifikasi untuk tuple
Setelah perhitungan selesai, maka dihasilkan tersebut. Permasalahan yang dihadapi kebanyakan
pohon keputusan yang dapat diubah menjadi rules algoritma pohon keputusan adalah sebagai berikut:
menggunakan kaidah IF-THEN-ELSE. Penjelasan a. Memilih atribut pemisahan
rules tersebut adalah sebagai berikut: b. Memesan atribut pemisahan
a. IF-THEN Rule c. Jumlah perpecahan yang harus diambil
Peraturan induksi: adalah proses penggalian d. Saldo struktur pohon dan pemangkasan
berguna 'jika kemudian' aturan dari data e. Menghentikan kriteria
berdasarkan signifikansi statistik. Sebuah sistem
Rule berdasarkan membangun satu set if-then- 3.1.6. Naïve Bayes
aturan. Pengetahuan merupakan telah Naïve Bayes merupakan metode yang tidak
pengumpulan bentuk dan strategi penyimpanan memeiliki aturan, Naïve Bayes menggunakan
dapat dibuat di ini. Untuk analisis, semua data cabang matematika yang dikenal dengan teori
perlu dikonsolidasikan sehingga dapat probabilitas untuk mencari peluang terbesar dari
diobati secara konsisten. kemungkinan klasifikasi, dengan cara melihat
b. IF kondisi THEN Kesimpulan frekuensi tiap klasifikasi pada data training. Naïve
Aturan ini terdiri dari dua bagian. Aturan yang bayes merupakan metode klasifikasi popular dan
(bagian IF) mengandung satu atau lebih kondisi masuk dalam sepuluh algoritma terbaik dalam data
sekitar nilai prediktor atribut mana sebagai mining, algoritma ini juga dikenal dengan nama
akibat aturan (THEN bagian) berisi prediksi Idiot’s Bayes, Simple Bayes dan Idependence Bayes
tentang nilai atribut tujuan. Prediksi yang akurat (Bramer, Max, 2007).
dari nilai atribut tujuan akan meningkatkan
proses pengambilan keputusan. IF-THEN aturan Klasifikasi Naïve Bayes adalah pengklasifikasian
prediksi sangat populer di data mining. Mereka statistik yang dapat digunakan untuk memprediksi
mewakili menemukan pengetahuan pada tingkat probabilitas keanggotaan suatu class. Klasifikasi
tinggi abstraksi. Aturan Induksi Metode Bayesian didasarkan pada teorema Bayes, diambil
memiliki potensi untuk menggunakan kasus dari nama seorang ahli matematika yang juga
diambil untuk prediksi. menteri Prebysterian Inggris, Thomas Bayes (1702-
1761) (Larose, 2015). Klasifikasi Bayesian memiliki
3.1.5. Pohon Keputusan (Decision Tree) kemampuan klasifikasi serupa dengan decision tree
Pohon keputusan ini adalah struktur dan neural network (Maimon, Oded and Rokach,
representasi pengetahuan yang terdiri dari simpul Lior, 2010).
dan cabang yang diorganisasikan dalam bentuk
pohon semacam itu bahwa setiap simpul non-daun P(x|y) = P(y|x) P(x) (3)
internal diberi label dengan nilai atributnya. Cabang- P(y)
cabangnya keluar dari internal node diberi label
dengan nilai atribut pada node tersebut. Setiap Keterangan:
simpul diberi label dengan kelas (nilai tujuan y = data dengan kelas yang belum diketahui
atribut). Model berbasis pohon yang meliputi x = hipotesis data y merupakan suatu kelas
klasifikasi dan regresi pohon, adalah implementasi spesifik
umum dari pemodelan induksi. Model pohon P(x|y) = probabilitas hipotesis x berdasar kondisi
keputusan yang terbaik cocok untuk data mining. y (posteriori probability)
Mereka murah untuk membangun, mudah P(x) = probabilitas hipotesis x (prior
ditafsirkan, mudah diintegrasikan dengan sistem probability)
database dan mereka memiliki akurasi yang P(y|x) = probabilitas y berdasarkan kondisi pada
sebanding atau lebih baik aplikasi. Ada banyak hipotesis x
algoritma pohon keputusan seperti itu sebagai P(y) = probabilitas dari y
algoritma HUNTS (ini adalah salah satu algoritma
paling awal), CART, ID3, C4.5 (algoritma ID3 versi 4. HASIL DAN PEMBAHASAN
selanjutnya), SLIQ, SPRINT. (Krishnaiah, 2013:4).
4.1. Basis Pengetahuan
Menurut pendapat Adhataro (2013), Dalam Pada basis pengetahuan, akan dijelaskan tabel
pembelajaran decision tree, ID3 (Iterative gangguan austime, tabel gejala autisme, tabel
Dichotomiser 3) adalah algoritma yang diciptakan keputusan autisme, rule-rule dan pohon keputusan.
oleh Ross Quinlan biasa membuat pohon keputusan Yang akan dijelaskan secara rinci sebagai berikut:
dari dataset. ID3 biasanya digunakan di mesin
belajar dan pengolahan bahasa alami. Teknik
pengambilan keputusan melibat-kan membangun
pohon untuk memodelkan proses klasifikasi. Begitu

4.1.1. Tabel Gangguan Autisme
Tabel Gangguan Autisme akan menampilkan 4.1.3. Tabel Keputusan Gangguan Autisme
gangguan-gangguan autisme/perkembangan yang Tabel keputusan gangguan ini menampilkan
dialami pada anak. relasi antara gangguan autisme dengan gejala
Tabel 1. Tabel gangguan autisme autismenya.
Kode Gangguan Nama Gangguan Tabel 3. Tabel keputusan gangguan autisme
GG01 Gangguan Perilaku Gangguan Autisme
Gejala
GG02 Gangguan Komunikasi GG01 GG02 GG03
GG03 Gangguan Interaksi Sosial GJ01 Ya Ya Ya
GJ02 Ya Tidak Ya
4.1.2. Tabel Gejala Autisme GJ03 Ya Tidak Ya
Tabel Gejala Autisme akan menampilkan data
GJ04 Tidak Ya Tidak
gejala-gejala autisme/perkembangan yang dialami
pada anak. GJ05 Ya Tidak Tidak
Tabel 2. Tabel gejala autisme GJ06 Ya Tidak Tidak
Kode Nama Gejala
GJ07 Ya Tidak Tidak
Gejala
GJ01 Tidak memiliki kontak mata GJ08 Ya Tidak Tidak
GJ02 Suka diam/menyendiri GJ09 Ya Tidak Tidak
GJ03 Tidak suka dipeluk GJ10 Tidak Ya Tidak
GJ04 Tidak dapat merespon jika dipanggil GJ11 Tidak Ya Tidak
orang GJ12 Tidak Ya Tidak
GJ05 Suka melakukan kegiatan/gerakan GJ13 Tidak Ya Tidak
secara berulang-ulang
GJ14 Tidak Ya Tidak
GJ06 Suka terpaku terhadap benda-benda
tertentu GJ15 Tidak Ya Tidak
GJ07 Suka menyukai hal yang aneh seperti GJ16 Tidak Ya Tidak
mencium-cium benda GJ17 Tidak Ya Tidak
GJ08 Suka mengungkapkan emosi (sedih,
senang, marah dll) dengan sendirinya GJ18 Tidak Tidak Ya
tanpa sebab GJ19 Tidak Tidak Ya
GJ09 Tidak bisa diam GJ20 Tidak Tidak Ya
GJ10 Tidak dapat berbicara GJ21 Tidak Tidak Ya
GJ11 Bisa berbicara namun tidak jelas GJ22 Tidak Tidak Ya
GJ12 Sering berbicara berlebihan GJ23 Tidak Tidak Ya
GJ13 Suka mengucapkan bahasa/kata-kata GJ24 Tidak Tidak Ya
yang aneh secara berulang-ulang
GJ14 Tidak dapat menunjuk sesuatu dengan 4.2. Algoritma C4.5
jari sendiri Pada tahapan ini dilakukan analisa
GJ15 Tidak dapat menunjukkan keinginan perhitungan terhadap kasus permasalahan, dalam
dengan kata-kata penelitian ini menggunakan Algoritma C4.5. Akan
GJ16 Suka menarik-narik orang lain jika dijelaskan secara rinci detail Algoritma C4.5
menginginkan sesuatu menjadi analisa perhitungan, rule-rule yang
GJ17 Tidak ada usaha dalam berkomunikasi dihasilkan dan gambaran pohon keputusan (decision
GJ18 Menghindar jika didekati tree).
GJ19 Tidak dapat berinteraksi dengan
lingkungan sekitar 4.2.1. Analisa Perhitungan
Dalam penelitian ini akan dilakukan
GJ20 Tidak tertarik dengan orang lain
eksperimen dengan menggunakan metode klasifikasi
GJ21 Tidak peduli dengan sekitarnya data mining Algoritma C4.5 dan Decision Tree
GJ22 Tidak suka dengan keramaian terhadap data anak dengan gejala-gela yang
dialaminya. Data akan diolah dengan menggunakan
GJ23 Tidak suka bermain dengan teman
algoritma C4.5 dan menghasilkan model, maka
sebayanya
terhadap model yang dihasilkan tersebut dilakukan
GJ24 Tidak dapat bersosialisasi dengan
pengujian menggunakankan k-fold cross validation.
orang lain

Gambar 3. Peluang gangguan autisme
Dari tabel analisa perhitungan tersebut diatas,

akan diperhitungkan nilai entropy dan gain dari n | Si |
masing-masing gejala. Berikut perhitungan nilai Gain( S , A) = Entropy ( S ) − ∑ x Entropy (Si)
entropy dan nilai gain node pertama: i =0 | S |
n n | GJ 04 | x Entropy (GJ04)
Entropy ( S ) = ∑ − Pi * log 2 Pi
Gain(Total , Gj 04) = Entropy ( S ) − ∑
i = 0 | Total |
i =0
 18  18    20  20    12  12     14   35 
Entropy (Total ) =  −
 50
x log 2   + −
 50    50
x log 2   + −
 50    50
x log 2   = 1.553520951
 50  
Gain(Total , Gj 04) = 1.553520951 −   x0  +  x1.459147917   = 0.50293445
  50   50 
 0  0    14  14    0  0 
Entropy (GJ 04, Ya) =  − x log 2   + − x log 2   + − x log 2   = 0
 50  50    50  50    50  50  
Dari perhitungan tersebut dalam diringkas secara
 18
Entropy (GJ 04, Tidak ) =  −
 18    6
x log 2   + −
 6    12
x log 2   + −
 12  
x log 2   = 1.459147917
rinci didalam tabel berikut:
 50  50    50  50    50  50  
Tabel 5. Tabel analisa perhitungan

Gangguan
Jumlah Gangguan Gangguan
Gejala Autisme Interaksi Entropy Gain
Kasus Perilaku Komunikasi
Sosial
Total 50 18 20 12 1.55352095
GJ01 0.04560071
Ya 33 9 15 9 1.53948476
Tidak 17 9 5 3 1.44664796
GJ02 0.40666004
Ya 38 18 8 12 1.50902751
Tidak 12 0 12 0 0
GJ03 0.45311915
Ya 37 18 7 12 1.48702946
Tidak 13 0 13 0 0
GJ04 0.50293445

Ya 14 0 14 0 0
Tidak 36 18 6 12 1.45914792
GJ05 0.35357947
Ya 16 13 3 0 0.69621226
Tidak 34 5 17 12 1.43699052
Dari hasil perhitungan nilai entropy dan nilai

gain yang terdapat pada tabel 5 terlihat bahwa
atribut GJ04 (Tidak dapat merespon jika dipanggil
orang) mempunyai nilai gain paling tinggi yaitu
0.5029344. Oleh karena itu GJ04 (Tidak dapat
merespon jika dipanggil orang) akan menjadi akar
(node pertama) dari pohon keputusan yang
terbentuk. Setelah didapatkan nilai gain yang
tertinggi maka selanjutnya dihitung dengan cara
yang sama dengan menggunakan persamaan entropy
untuk mendapatkan nilai entropy dan persamaan
gain untuk mendapatkan nilai gain. Model yang telah dibentuk diuji tingkat
Setelah dilakukan hasil perhitungan nilai akurasinya dengan memasukan atau uji yang berasal
entropy dan nilai gain, maka akan terbentuk pohon dari data training dengan menggunakan cross
keputusan seperti gambar 4 validation pada aplikasi ripedminer untuk menguji
tingkat akurasi. Dengan aplikasi ripedminer
dihasilkan nilai akurasi, nilai class recall dan nilai
Gambar 4. Pohon keputusan (Decision Tree) class precision yang akan dijelaskan pada gambar
dibawah ini:
Setelah pohon keputusan (decision tree)
terbentuk, selanjutnya dilakukan perubahan menjadi Gambar 5. Nilai akurasi perhitungan Algoritma C4.5
rule, berikut ini merupakan pembentukan rule tree.
Rule 1 Dari gambar 5 diatas dijelaskan bahwa gangguan
IF GJ04 == Ya interaksi sosial menghasilkan class recall sebesar
THEN Gangguan Komunikasi
Rule 2
IF GJ04 == Tidak
AND GJ05 == Ya
THEN Gangguan Perilaku
Rule 3
IF GJ04 == Tidak
AND GJ05 == Tidak 66,67% dan class precision sebesar 61.54%,
AND GJ20 == Ya sedangkan gangguan komunikasi menghasilkan
THEN Gangguan Interaksi Sosial class recall sebesar 65.00% dan class precision
Rule 4 sebesar 92.86% serta gangguan perilaku
IF GJ04 == Tidak menghasilkan class recall sebesar 83.33% dan class
AND GJ05 == Tidak precision sebesar 65.22% dan nilai akurasi dari
AND GJ20 == Tidak perhitungan algoritma C4.5 tersebut diatas adalah
AND GJ01 == Ya sebesar 72%.
THEN Gangguan Interaksi Sosial
Rule 5 4.3. Naïve Bayes
IF GJ04 == Tidak Pada tahapan ini dilakukan analisa
AND GJ05 == Tidak perhitungan terhadap kasus permasalahan, dalam
AND GJ20 == Tidak penelitian ini menggunakan Naïve Bayes. Akan
AND GJ01 == Tidak dijelaskan secara rinci detail Naïve Bayes sebagai
THEN Gangguan Perilaku berikut:

Gambar 6. Perhitungan Algoritma Naïve Bayes
Model yang telah dibentuk diuji tingkat Dari gambar 7 diatas dijelaskan bahwa gangguan
akurasinya dengan memasukan atau uji yang berasal interaksi sosial menghasilkan class recall sebesar
dari data training dengan menggunakan cross 100% dan class precision sebesar 80%, sedangkan
validation pada aplikasi ripedminer untuk menguji gangguan komunikasi menghasilkan class recall
tingkat akurasi. Dengan aplikasi ripedminer sebesar 50.00% dan class precision sebesar 100%
dihasilkan nilai akurasi, nilai class recall dan nilai serta gangguan perilaku menghasilkan class recall
class precision yang akan dijelaskan pada gambar sebesar 100% dan class precision sebesar 50% dan
dibawah ini: nilai akurasi dari perhitungan algoritma Naive Bayes
tersebut diatas adalah sebesar 73.33%.
5. KESIMPULAN
5.1. Kesimpulan
Dari hasil penelitian yang sudah dilakukan,
dapat disimpulkan bahwa deteksi dini gangguan
autisme pada anak dapat diprediksi dengan
memanfaatkan teknik data mining dengan
Gambar 7. Nilai akurasi perhitungan Naïve Bayes menggunakan metode algoritma C4.5 dan Naïve
Bayes untuk memprediksi gangguan autisme pada
anak berdasarkan gejala yang dialami anak. Setelah

dilakukan pengujian dengan metode cross validation in Computer Science and Engineering
pada aplikasi ripedminer, Algoritma C4.5 (IJERCSE). Vol 4, Issue 9. ISSN 2394-2320.
menunjukkan hasil nilai akurasi sebesar 72% 145-149.
sedangkan Algoritma Naïve Bayes menunjukkan Rahmawati, Eva. 2015. Analisa Komparasi
nilai akurasi yang lebih besar dan lebih baik yaitu Algoritma Naïve Bayes dan C4.5 Untuk
sebesar 73.33%. Prediksi Penyakit Liver. Jurnal Techno Nusa
Mandiri. Vol X11 No.12, September 2015. 27-
37.
DAFTAR PUSTAKA Tutik A, Gusti Ayu Kadek, Rosa Delima dan umi
Proboyekti. 2009. Penerapan Forward Chaining
Aanchal Oswal, Vachana Shetty, Mustafa Badshah, Pada Program Diagnosa Anak Penderita
Rohit Pitre, Manali Vashi. 2014. A Survey On Autisme. Yogyakarta. Jurnal Informatika
Disease Diagnosis Algorithms. International Volume 5 Nomor 2 November 2009: 46-59.
Journal of Advanced Re-search in Computer Diambil
Engineering & Technology (IJAR-CET). dari: http://ti.ukdw.ac.id/ojs/index.php/informati
Volume 3 Issue 11. 3757-3761. ka/article/viewFile/73/35. (20 Oktober 2014)
Akila and S. Chandramathi. 2015. A Hybrid Method
for Coro-nary Heart Disease Risk Prediction
using Decision Tree and Multi Layer
Perceptron. Indian Journal of Science and
Technology. Vol 8. 1-7.
Badr Hssina, Abdelkarim Merbouha, Hanane Ez-
Zikouri, Mohammed Erritali. A comparative
study of decision tree ID3 and C4.5.
International Journal of Ad-vanced Computer
Science and Applications. 13-19.
Grand dan Richardus Eko Indrajit. 2017. Aplikasi
Deteksi Dini Untuk Mengenali Anak
Berkebutuhan Khusus Menggunakan Metode
Business Intelligence. Seminar Nasional Sains
dan Teknologi 2017, Fakultas Teknik
Universitas Muhammadiyah Jakarta. ISSN:
2407-1846. 1-11.
Jayawardanu, Ivana Herliana and Seng Hansun.
2015. Rancang Bangun Sistem Pakar Untuk
Deteksi Dini Katarak Menggunakan Algoritma
C4.5. Ultima Computing. Vol. VII, No.2, ISSN:
2355-3286. 48-58.
Krishnaiah, V. Dr.G.Narsimha, Dr.N.Subhash
Chandra. 2013. Diagnosis of Lung Cancer
Prediction System Using Data Mining
Classification Techniques. International
Journal of Computer Science and Information
Technologies. Vol 1. 39-45.
Kalpesh Adhataro, Aditya Gaykar, Amiraj Dhawan,
Rohit Jha and Vipul Honrao. 2013. Predicting
Students Performance Using ID3 and C4.5
Classification Algorithms. International Journal
of Data Mining & Knowledge Management
Process (IJDKP), Vol.3, No.5. 39-52.
Manikantan, V and S. Latha. 2013. Predicting The
Analysis of Heart Disease Symptoms Using
Medicinal Data Mining Methods. International
Journal on Advanced Computer Theory and
Engineering (IJACTE). Vol.2, Issue-2, ISSN:
2319-2526. 5-10.
Mirajkar, Pallavi and Dr. G. Prasanna Laksmi. 2017.
Prediction of Cancer Risk in Perspective of
Symptoms using Naïve Bayes Classifier.
International Journal of Engineering Re-search

308-Article Text-377-1-10-20181116

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

308-Article Text-377-1-10-20181116

Diunggah oleh

Hak Cipta:

Format Tersedia

PERBANDINGAN AKURASI ALGORITMA C4.

5 DAN NAÏVE BAYES

Bayu Sugara1, Dedi Adidarma2, Sularso Budilaksono3

1. PENDAHULUAN oleh anaknya dan bagaimana cara penanganannya.

Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316 119

1.2. Rumusan Masalah Wawancara dilakukan kepada para pakar/dokter

2. METODOLOGI 3.1.1. Penelitian Terdahulu

120 Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316

Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316 121

Sedangkan untuk perhitungan nilai entropy dapat

122 Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316

Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316 123

124 Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316

Dari tabel analisa perhitungan tersebut diatas,

Tabel 5. Tabel analisa perhitungan

Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316 125

Dari hasil perhitungan nilai entropy dan nilai

126 Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316

Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316 127

128 Jurnal IKRA-ITH Informatika Vol 3 No 1 Maret 2019 ISSN 2580-4316

Anda mungkin juga menyukai