2274 6413 1 PB

Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
Analisis Penerapan Algoritma ID3 dalam Mendiagnosis Kesuburan Pria

Khaerul Ma’mur
Teknik Informatika, Fakultas Teknik, Universitas Pamulang, Tangerang Selatan, Banten, Indonesia
Email: kemunk.alfatih@gmail.com
Abstract
Men’s fertility disorder is one of difficult thing to be diagnosed, if fertility has a problem, the
fertilization process will be disrupted. That’s all to be the most predominant cause of discordant
household. Numbers of data on men's fertility are obtained by detailed enough. Secondary data from this
dataset, made a reference in making decision tree using the ID3 algorithm in software Rapid Miner.
Iterative Dichotomizer (ID3) is used because it is one of the commonly used classification algorithm in
Data Mining to implement decisions of some attributes that have been determined in accordance with the
data customized with their needs. ID3 algorithm generally calculates the Entropy value of each attribute
and the value of the Information Gain of each attribute that are able to form a decision tree that is
expected to assist in decision making. The results of the tests and the method can be used to diagnose
men’s fertility appropriately with a fairly high degree of accuracy.
Keywords: Decision Tree, Data Mining, Iterative Dichotomizer 3, Men’s Fertility
1. Pendahuluan untuk membantu pemrosesan datanya

Masalah ketidasuburan pada seseorang menggunakan pohon keputusan (decision tree).
menjadi salah satu penyebab renggangnya suatu Pohon keputusan membangun model
hubungan dalam rumah tangga. Terlebih apabila klasifikasi atau regresi dalam bentuk struktur
ada rumah tangga yang belum dikaruniai pohon. Pembangunanan model tersebut digunakan
keturunan. Seperti yang diketahui pada umumnya untuk memecah dataset menjadi himpunan bagian
bahwa penilaian di tengah-tengah masyarakat, jika yang lebih kecil sementara pada saat yang sama
ada seorang wanita yang susah hamil maka pohon keputusan terkait, dikembangkan secara
cenderung hanya wanitanya saja yang dituntut bertahap. Node daun mewakili klasifikasi atau
untuk mencari tahu penyebabnya. keputusan. Node keputusan teratas dalam pohon
Gaya hidup yang kurang sehat menjadi salah yang sesuai dengan prediktor terbaik disebut
satu faktor penyebabnya. Adanya pola serta gaya simpul akar. Pohon keputusan dapat menangani
hidup di masyarakat yang kurang sehat, secara tak data kategorikal dan numerik. Oleh karena itu
langsung, punya peran memengaruhi kualitas digunakan model berupa pohon keputusan yang
kesuburan sperma pada pria yang dapat dapat dijadikan rujukan alternatif dengan
mengakibatkan sulitnya pasangan suami istri menggunakan bantuan algoritma ID3.
memiliki anak (Irvine DS, 1998). Algoritma ID3 (Iterative Dichotomiser Tree)
Untuk pemeriksaan, pria yang mempunyai digunakan pada penelitian ini karena algoritma
masalah dengan kesuburan dapat berkonsultasi ID3 menentukan nilai bobot dari tiap atribut, yang
kepada seorang dokter spesialis, khususnya kemudain dilanjutkan dengan seleksi alternatif.
spesialis urologi. Dokter akan melakukan Selain itu algoritma ID3 juga dapat dijadikan
identifikasi masalah atau mendiagnosis sekaligus pilihan kepada pria yang akan memeriksakan
mengambil tindakan yang tepat guna membantu kesuburannya ketika enggan ke rumah sakit.
mengatasi permasalahan tersebut.
Mengidentifikasi kesuburan pria dapat 2. Landasan Teori
dilakukan salah satunya menggunakan data Kesuburan
mining. Data mining dan machine learning dapat Dalam dunia kesehatan, permasalahan
digunakan untuk memprediksi berdasarkan data- kesuburan terjadi akibat adanya gangguan sistem
data masa lalu (Saifudin, 2018). Sebab metode, reproduksi pada wanita dan adanya penurunan
model, teknik, atau algoritma dalam data mining kualitas serta kuantitas sperma pada pria.
cukup banyak variasinya. Model yang digunakan Terjadinya masalah kesuburan atau infertilitas
dapat disimpulkan apabila sepasang suami istri
http://openjournal.unpam.ac.id/index.php/informatika 35
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
dalam tenggat waktu dua tahun atau lebih belum 1. Clustering

dikaruniai kehamilan sedangkan setiap kali Analisis Clustering merupakan bagian
‘berhubungan’ tidak pernah menggunakan alat dari proses mengidentifikasi data set yang
pencegah kehamilan. mirip antara satu sama lain, untuk
Ada banyak faktor yang dapat memengaruhi memahami perbedaan serta kesamaan
kesuburan sperma pada pria, salah satunya yaitu dalam data. Cluster memiliki kesamaan
kebiasaan gaya hidup dan lingkungan (David dkk, sifat-sifat tertentu yang dapat digunakan
2012). Berikut ini beberapa penyebab terjadinya untuk meningkatkan algoritma
permasalahan yang mengganggu kesuburan pada penargetan. Misalnya, kelompok
seorang pria antara lain: pelanggan dengan perilaku pembelian
1) Adanya kelainan genetik yang sama dapat ditargetkan dengan
2) Gangguan hormonal produk dan layanan serupa untuk
3) Kelainan skrotum meningkatkan tingkat percakapan. Tujuan
4) Sumbatan pada saluran sperma penggunaan teknik clustering yaitu guna
5) Disfungsi ereksi dibuat kelompok data atau objek ke dalam
6) Banyak konsumsi rokok kumpulan cluster sehingga tiap cluster
7) Sering minum alkohol akan berisi data-data yang cukup mirip
8) Paparan radiasi (Larose, D. T., 2005).
9) Konsumsi obat-obatan 2. Association Rule (Market Basket
Analysis)
Data Mining Kegunaan teknik ini memungkinkan
Data mining (penambangan data) adalah penemuan hubungan yang menarik
proses berbantuan komputer untuk mencari dan (interdependensi) antara berbagai variabel
menganalisis set data yang sangat besar dan dalam database besar. Association rule
mencoba memahami makna data. Penambangan learning mengungkap pola yang belum
data adalah metode analisis yang memungkinkan terlihat pada data yang bisa diterapkan
komputer mengekstrak informasi yang dapat untuk mengidentifikasi variabel dalam
digunakan dari kumpulan data mentah yang sangat data dan kejadian bersama dari berbagai
besar. variabel yang muncul dengan frekuensi
Data mining memproses informasi terstruktur terbesar.
melalui aplikasi kecerdasan buatan, jaringan saraf, 3. Classification
dan alat statistik canggih untuk mendeteksi pola Analisis klasifikasi yaitu proses sistematis
dan merangkum data ke dalam format yang dapat guna memperoleh informasi dan
dipahami. sekelompok model yang relevan dari data
Mulanya data mining menyertakan proses set. Analisis klasifikasi membantu
otomatisasi sebagai fokus utamanya. Data mining mengidentifikasi kategori atau kelas-kelas
dijadikan salah satu proses penjabaran dan analisis yang dimiliki data. Analisis klasifikasi
dengan cara otomatis ataupun semi otomatis terkait erat dengan analisis cluster karena
kepada data dengan jumlah yang besar untuk klasifikasi dapat digunakan untuk data
menentukan pola atau rule yang akan digunakan cluster.
(Berry dan Linoff, 2004). 4. Regression (Predictive)
Data mining juga merupakan proses Analisis regresi merupakan teknik dalam
menganalisis sejumlah besar data untuk mendefinisikan ketergantungan antar
menemukan pola dan informasi lainnya. Ini variabel. Analisis regresi dapat
biasanya dilakukan pada database, yang menunjukkan bahwa satu variabel
menyimpan data dalam format terstruktur. Dengan tergantung pada variabel lain tetapi tidak
‘menambang’ sejumlah besar data, informasi sebaliknya.
tersembunyi dapat ditemukan dan digunakan
untuk tujuan lain. Tahapan Data Mining
Sebuah keputusan yang tepat dalam
Teknik Data Mining penggunaan metodologi sistematis tak hanya saat
Sebagai acuan dalam penelitian ini, digunakan melakukan analisis saja namun saat
teknik data mining. Macam teknik data mining mempersiapkan data dan saat melakukan
yang umumnya diterapkan seperti di bawah ini interpretasi dari hasil penerapan data mining yang
(Dunham H. Margareth, 2002). mempunyai skala besar.
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
Secara umum proses data mining begitu 6. Presentasi pengetahuan. Tahap ini
interaktif karena terkadang hasil yang didapat mempresentasi pola yang diperoleh untuk
pada mulanya kurang sesuai terhadap harapan memperoleh tindakan tahap akhir dari
penganalisanya, sehingga pada prosesnya pemrosesan data mining yaitu seperti apa
memerlukan pengulangan desain. cara memformulasikan keputusan dari
hasil analisa yang telah didapat.
Pohon Keputusan
Pohon keputusan (decision tree) merupakan
struktur flowchart yang memiliki tree (pohon),
yang mana tiap simpul internal menandakan suatu
tes atribut, setiap cabang merepresentasikan hasil
tes, dan simpul daunnya merepresentasikan kelas
atau distribusi kelas (Santosa Budi, 2007). Pohon
keputusan juga bisa diartikan sebagai diagram
yang menyerupai diagram alur yang menunjukkan
berbagai hasil dari serangkaian keputusan. Pohon
keputusan membuat model prediksi berdasarkan
serangkaian percabangan yang menggunakan
fakta-fakta spesifik untuk membuat kesimpulan
yang lebih umum.
Gambar 1. Data mining sebagai bagian dari Pohon keputusan memiliki tiga bagian utama
proses knowledge discovery diantaranya simpul akar, simpul daun, dan cabang.
Simpul akar adalah titik awal dari pohon, dan
Tahapan-tahapan yang bersifat interaktif simpul akar dan daun berisi pertanyaan atau
dalam proses data mining di mana pengguna kriteria yang harus dijawab. Cabang adalah panah
terlibat secara langsung atau dengan perantara yang menghubungkan node, menunjukkan aliran
knowledge base (Tan, dkk, 2004) antara lain: dari pertanyaan ke jawaban. Setiap node biasanya
1. Pembersihan data. Berfungsi memilah memiliki dua atau lebih node yang memanjang
atau membersihkan data yang kerap darinya. Misalnya, jika pertanyaan di simpul
berubah-ubah serta mempunyai noise. pertama membutuhkan jawaban "ya" atau "tidak",
2. Intergrasi data. Diperlukan untuk data akan ada satu simpul daun untuk respons "ya", dan
mining yang bukan saja bersumber dari simpul lain untuk "tidak”.
satu database namun dapat pula dari
banyak database atau textfile. Hasil dari Algoritma ID3
pengintegrasian data akan ditampilkan ID3 merupakan pendahulu dari algoritma
berupa data warehouse, sebab data C4.5. Secara sederhana, ID3 membangun pohon
dikonsolidasikan melalui struktur khusus keputusan dari serangkaian contoh yang tetap.
yang efektif dan efisien. Pohon keputusan yang dihasilkan digunakan untuk
3. Transformasi data. Guna menentukan mengklasifikasikan sampel untuk dijadikan
seberapa berkualitasnya hasil dari data pedoman di masa yang akan datang. Contoh-
mining yang diperoleh, agar data dapat contoh dari data set yang diberikan memiliki
diubah ke dalam bentuk yang diinginkan. beberapa atribut dan setiap contoh milik kelas
4. Aplikasi teknik data mining. Salah satu (seperti ya atau tidak). Node daun pohon
bagian dari tahapan proses data mining. keputusan berisi nama kelas sedangkan node
Digunakan untuk memproses atau bukan daun adalah node keputusan. Node
mengolah data yang besar. keputusan adalah atribut dengan setiap cabang (ke
5. Evaluasi pola yang diperoleh. Pada tahap pohon keputusan lain) menjadi nilai yang
yang ke 5, hasil yang diperoleh dari mungkin dari tiap atribut. ID3 menggunakan
penggunaan data mining berbentuk pola- heuristik pemilihan fitur untuk membantunya
pola unik ataupun model prediksi dilihat memutuskan atribut mana yang masuk ke simpul
kembali untuk memberikan penilaian keputusan. Heuristik yang diperlukan dapat dipilih
mengenai hipotesa yang telah dirumuskan oleh parameter kriteria.
sudah sesuai atau belum sesuai rencana. Algoritma ID3 berupaya menghasilkan pohon
keputusan dengan urutan top-down (atas ke
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
bawah), melalui pertanyaan “mana atribut yang Tabel 1 Kategori Atribut

harus diperiksa terlebih dahulu dan ditempatkan Atribut Nilai Angka Kategori
pada root?”. Untuk menjawabnya dengan cara Musim -1 Dingin
-0,33 Semi
mengevaluasi seluruh atribut yang tersedia melalui 0,33 Panas
penggunaan sebuah ukuran statistik (seringnya 1 Gugur
menggunakan information gain) untuk melihat Usia 18-25 >18
sejauh mana tingkat keefektivan suatu atribut 26-30 >25
ketika mengkelompokkan sekumpulan sampel 31-36 >31
Penyakit masa kecil 0 Ya
data (David, Mcg, 2004). 1 Tidak
Kecelakaan atau 0 Ya
Rapid Miner Trauma serius 1 Tidak
Rapid miner dibuat oleh Dr. Markus Riwayat Operasi 0 Ya
1 Tidak
Hofmann dari Institute of Technology Demam tahun lalu -1 >3 bulan
Blanchardstown dan Ralf Klinkenberg dari rapid- 0 <3bulan
i.com. Menggunakan GUI (Graphical User 1 Tidak
Interface) yang apik sangat mempermudah user Konsumsi Alkohol 0,2 Beberapa kali sehari
saat mengoperasikan rapid miner. Aplikasi ini 0,4 Tiap Hari
0,6 Beberapa kali seminggu
dibuat dengan bahasa pemrograman Java di bawah 0,8 Sesekali
lisensi GNU Public License, sehingga berlisensi 1 Tidak Pernah
open source. Untuk menjalankan perangkat lunak Merokok -1 Sesekali
ini dapat berjalan di semua operating system. 0 Tiap hari
1 Tidak pernah
Untuk mengoperasikan aplikasi Rapid Miner,
Duduk (dalam 1-4 Sebentar
tidak diperlukan kemampuan khusus, sebab sehari/jam) 5-8 Cukup lama
fiturnya sudah cukup lengkap. Rapid Miner 9-12 Normal
ditujukan khusus untuk pengelolaan data dalam 13-16 Sangat lama
jumlah yang banyak. Model Bayesian, Neural
Network, Tree Induction, dan lain sebagainya Data yang telah tersusun seperti di atas,
disediakan dalam aplikasi guna membentuk kemudian dimasukkan ke dalam aplikasi Rapid
pemodelan. Metode yang tersedia pada rapid Miner untuk membuat pohon keputusan yang
miner juga cukup banyak, diantaranya klustering, sistematis. Berikut penggambaran untuk
asosiasi, klasifikasi, dan lain-lain. menjadikan pohon keputusannya.
3. Hasil dan Pembahasan

Pengolahan data
Data yang dijadikan sebagai bahan penelitian
bukan merupakan data primer, di mana data
tersebut diambil dari WHO (World Health
Organization) pada tahun 2010 yang
dipublikasikan oleh UCI dataset machine
learning. Dengan rincian 100 relawan
memberikan sampel sperma (air mani) yang
dianalisis menurut kriteria WHO. Konsentrasi
kesuburan terkait dengan data sosio-demografis,
faktor lingkungan, status kesehatan, dan kebiasaan
hidup.
Data mentah yang telah didapat kemudian Gambar 2 Relasi antara data training dan model
diolah untuk diubah ke dalam data kategorial
karena ID3 tidak dapat membaca data dalam Ikuti alur seperti pada gambar di atas.
bentuk numerik. Berikut disajikan dalam bentuk Setelah di eksekusi, dengan mengklik tanda Run,
tabel. maka hasilnya terlihat seperti pada gambar yang
ditampilkan di bawah ini.
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
Gambar 3. Pohon keputusan hasil ekstraksi dari tools Rapid Miner
Dan didapat pula rule (aturan-aturan) yang | | musim = semi: subur {subur=8,
didapatkan dari pohon keputusan tersebut. Berikut masalah=0}
aturan-aturanya. | kebiasaan duduk = L
| | musim = dingin: subur {subur=2,
usia = > 18 masalah=1}
| pernah demam tinggi = < 3 bulan | | musim = gugur: masalah {subur=1,
| | riwayat bedah = tidak: subur {subur=3, masalah=2}
masalah=0} | | musim = panas: masalah {subur=0,
| | riwayat bedah = ya: subur {subur=1, masalah=1}
masalah=1} | | musim = semi: subur {subur=2,
| pernah demam tinggi = > 3 bulan: subur masalah=1}
{subur=27, masalah=0} | kebiasaan duduk = S: masalah {subur=1,
| pernah demam tinggi = tidak ada: subur masalah=1}
{subur=14, masalah=0} | kebiasaan duduk = SL: subur {subur=2,
usia = > 25 masalah=0}
| kebiasaan duduk = CL usia = > 31
| | musim = dingin: subur {subur=8, | konsumsi alkohol = BKS: subur {subur=5,
masalah=0} masalah=0}
| | musim = gugur | konsumsi alkohol = SS: masalah {subur=0,
| | | pernah demam tinggi = < 3 bulan: masalah=1}
subur {subur=1, masalah=0} | konsumsi alkohol = TP: subur {subur=3,
| | | pernah demam tinggi = > 3 bulan masalah=0}
| | | | pernah kecelakaan = tidak: subur
{subur=4, masalah=0} Pengujian
| | | | pernah kecelakaan = ya Guna mengetahui tingkat ketepatan dan
| | | | | konsumsi alkohol = BKS: subur keberhasilan dari penelitian yang dilakukan, bisa
{subur=1, masalah=1} dilihat dari hasil kerja model yang terbentuk.
| | | | | konsumsi alkohol = SS: masalah Pengujian penelitian ini diharapkan dapat
{subur=1, masalah=2} mendapatkan model yang tepat dalam
| | | | | konsumsi alkohol = TP: subur mendiagnosis kesuburan seorang pria
{subur=2, masalah=0} menggunakan algoritma ID3 dengan baik.
| | | pernah demam tinggi = tidak ada: Model yang telah dikembangkan akan diuji
masalah {subur=0, masalah=1} keakuratannya dengan memasukkan beberapa data
| | musim = panas: subur {subur=2, uji ke dalam pemodelan. Guna menghitung
masalah=0} keakuratan model secara tepat, data uji sebaiknya
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
bukan data yang berasal dari data training (Han, digunakan perbandingan seperti pada tabel di
J., & Kamber, M. 2006). Namun, dikarenakan data bawah ini:
sampel hanya terdapat sejumlah 100, maka data
training yang digunakan juga akan dijadikan data Tabel 2 Model Confussion Matrix
testing. Correct Classified as
Guna memperoleh hasil prediksi dari Classification Positive Negative
penggunaan ID3, sampel yang tersedia diuji ke Positive True Positives False Negatives
dalam data training. Dalam pengujian ini, Negative False True Negatives
ditambahkan metode untuk menyeleksi atribut lain Negatives
berupa gini index dan gain ratio dengan maksud
mencari tahu nilai akurasi dari masing-masing True positives adalah tupel positif pada data
metode penyeleksian atribut melalui algoritma set yang dikategorikan positif. Sedangkan true
yang sama yaitu ID3. negatives adalah tupel negatif pada data set yang
dikategorikan negatif. False positives adalah tupel
positif pada data set yang dikategorikan negatif
sedangkan untuk false negatives adalah jumlah
tupel negatif yang dikategorikan positif.
Sesudah memasukkan data pengujian ke
dalam model confusion matrix, akan dihitung
nilai yang sudah dimasukkan sebelumnya untuk
diketahui jumlah sensitivity, specificity, precision
dan accuracy. Jumlah sensitivity dipakai guna
membuat perbandinan jumlah true positives
kepada jumlah tupel yang positives sedangkan
specificity ialah untuk membandingkan jumlah
true negatives terhadap jumlah tupel yang
negatives. Dalam mengevaluasinya digunakan
perhitungan seperti di bawah ini.
𝑡_𝑝𝑜𝑠
sensitivity = 𝑝𝑜𝑠
𝑡_𝑛𝑒𝑔
specificity = 𝑛𝑒𝑔
𝑡_𝑝𝑜𝑠
precision =(𝑡_𝑝𝑜𝑠 + 𝑓_𝑝𝑜𝑠)
𝑝𝑜𝑠 𝑛𝑒𝑔
accuracy=sensitifity 𝑝𝑜𝑠 + 𝑛𝑒𝑔 + specificity 𝑝𝑜𝑠 + 𝑛𝑒𝑔
di mana:
t_pos = jumlah true positives
t_neg = jumlah true negatives
Gambar 4 Pola Pencarian dan Pengujian Model pos = jumlah tupel positif
neg = jumlah tupel negatif
Dari hasil penerapan seperti gambar di atas, f_pos = jumlah false positives
berikutnya akan dilihat kembali tingkat akurasinya
dengan menggunakan dua model yaitu confusion Nilai sensitivity, specificity, accuracy,
matrix dan ROC (Receiver Operating precision, dan recall dari data training yang telah
Characteristic). dihitung menggunakan tools rapid miner diuji
menggunakan perhitungan split-validation dengan
1. Evaluasi model confusion matrix. kriteria information gain. Dengan mengikuti
Evaluasi ini digunakan guna mengukur prosedur dari tools rapid miner hasil pengukuran
keakuratan model yang terbentuk yaitu yang telah otomatis di split (pembagian) sebesar
menggunakan confusion matrix. Pada evaluasi ini 0,75 guna mencari nilai akurasi tertinggi dari data
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
training. Hasil pembagiannya seperti tabel di

bawah ini.
Tabel 3 Konversi ke confusion matrix

true true
Subur Bermasalah
pred. Subur 21 1
pred. Bermasalah 1 2
Dari pembagian seperti tabel di atas, nilai

masing-masingnya menghasilkan angka dalam
persen seperti di bawah ini.
Gambar 6 Kurva ROC dengan AUC Optimistic
Tabel 3 Nilai sensitivity, specificity, precision,
recall, dan accuracy dalam persentase.
Nilai Angka (%)
Sensitivity 67
Precision 67
Recall 67
Specificity 95
95
Accuracy 92
2. Evaluasi model menggunakan kurva ROC

(Receiver Operating Characteristic)
Hasil yang ditampilkan pada gambar 5
memperlihatkan grafik ROC beserta nilai AUC
(Area Under Curve) umum. Sedangkan gambar 6
menunjukkan grafik ROC dengan asumsi optimis. Gambar 7 Kurva ROC dengan AUC Pesimistic
Dan pada gambar 7 menggambarkan grafik ROC
dengan nilai AUC pesimis. 4. Kesimpulan
Untuk penilaian keakuratannya digunakan Setelah dilakukan pengujian dan validasi
skala dari 0 hingga 1. Tingkat akurasi pada AUC terhadap data yang ada, didapatkan akurasi rata-
dianggap sempurna jika nilai AUC yang rata sebesar 92%. Pengukuran kinerja pada hasil
dihasilkan menempati angka 1,000 dan tingkat yang terbentuk dengan menerapkan metode
akurasinya dianggap kurang tepat apabila nilai pengukuran Confusion Matrix dan Kurva ROC.
AUC di bawah angka 0,500. Sehingga dapat disimpulkan analisis metode
algoritma ID3 terkait permasalahan dalam
mendiagnosis kesuburan pada pria merupakan
salah satu metode yang tepat dalam menentukan
sebuah konklusi dengan data kategorial.
Referensi
David, G., Jose Luis Girela, Joaquin De Juan, M. Jose
Gomez-Torrez, Magnus Johnsson, 2012,
“Predicting Seminal Quality with Artificial
Intelligence Methods”. Expert Systems with
Applications,
http://www.researchgate.net/publication/230868
076_Predicting_seminal_quality_with_artificial
_intelligence_methods/file/79e415058f10cc308
1.pdf, (Diakses 10 April 2016)
Gambar 5 Kurva ROC dengan AUC secara David, Mcg. 2004. Tutorial: The ID3 Decision Tree
umum Algorithm, Monash Uviversity Faculty of
Information Technology.
Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615
Dunham H. Margareth. 2002. Data Mining Larose, D. T. 2005. Discovering Knowledge in Data An
Introductory and Advantaced Topics, Southern Introduction to Data Mining. New Jersey: John
Methodist University. Willey and Sons.
Han, J., & Kamber, M. 2006. Data Mining Saifudin, A. (2018). Metode Data Mining untuk Seleksi
Concept and Tehniques. San Fransisco: Calon Mahasiswa pada Penerimaan Mahasiswa
Morgan Kauffman. Baru di Universitas Pamulang. Jurnal
Hand, D., Mannila, H. and Smyth, P.; 2001. Principles Teknologi, 10(1), 25-36.
of Data Mining. MIT Press. Santosa Budi. 2007. Data Mining: Teknik Pemanfaatan
Irvine DS. 1998. Epidemiology and aetiology of Data Untuk Keperluan Bisnis, Yogyakarta.
male infertility. Hum. Reprod.; Vol 13(1):33-44. Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar.
Kusrini & Luthfi, E. T. 2009. ”Algoritma Data Mining. 2004. Introduction to Data Mining. Boston:
Yogyakarta: Andi Publishing. Pearson.

2274 6413 1 PB

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

2274 6413 1 PB

Diunggah oleh

Hak Cipta:

Format Tersedia

Jurnal Informatika Universitas Pamulang ISSN: 2541-1004

Vol. 4, No. 2, Juni 2019 e-ISSN: 2622-4615

Analisis Penerapan Algoritma ID3 dalam Mendiagnosis Kesuburan Pria

Keywords: Decision Tree, Data Mining, Iterative Dichotomizer 3, Men’s Fertility

1. Pendahuluan untuk membantu pemrosesan datanya

dalam tenggat waktu dua tahun atau lebih belum 1. Clustering

bawah), melalui pertanyaan “mana atribut yang Tabel 1 Kategori Atribut

3. Hasil dan Pembahasan

Gambar 3. Pohon keputusan hasil ekstraksi dari tools Rapid Miner

training. Hasil pembagiannya seperti tabel di

Tabel 3 Konversi ke confusion matrix

Dari pembagian seperti tabel di atas, nilai

2. Evaluasi model menggunakan kurva ROC

Anda mungkin juga menyukai