Anda di halaman 1dari 13

Mariza Putri Sari Dewi Ningsih, Beta Noranita

Status Proses Persalinan Menggunakan Algoritma C4.5

Mariza Putri Sari Dewi Ningsih*1), Beta Noranita 2)

**
Jurusan Ilmu Komputer/Informatika, Fakultas Sains dan Matematika
Universitas Diponegoro
1)
smramarizaputri@gmail.com, 2) betanoranita.undip@gmail.com

Abstrak

Setiap orangtua pasti berusaha yang terbaik untuk persalinan akan berjalan lancar dan dapat
melahirkan bayi dengan sempurna. Keberadaan penentuan status proses persalinan menjadi
penting untuk mempersiapkan dalam hal kesehatan, dan psikologi. Proses persalinan pada seorang
ibu dapat ditempuh secara normal, akan tetapi sering kali terdapat beberapa faktor kesehatan yang
membuat proses persalinan seorang ibu dilakukan dengan operasi caesar. Aplikasi ini dibangun
untuk memberikan saran dalam menentukan proses persalinan yang harus dijalani oleh seorang
ibu hamil untuk meningkatkan keselamatan ibu dan bayi. Metode pada aplikasi data mining
penentuan status proses persalinan dengan menggunakan algoritma C4.5. Algoritma C4.5 dipilih
karena dapat menseleksi atribut dan mudah diinterpretasikan pada aturan yang terbentuk. Aplikasi
ini merupakan penggabungan teknologi informasi dan bidang kesehatan untuk membantu para ibu
hamil dalam menentukan status proses persalinan normal atau operasi caesar berdasarkan kondisi
kesehatan ibu dan janin. Atribut yang digunakan yaitu usia, riwayat penyakit, tekanan darah, urut
kehamilan, jarak kelahiran, riwayat caesar, gawat janin, kelainan letak, berat bayi, dan plasenta
proveria. Data rekam medis yang digunakan berjumlah 682 record dengan data training berjumlah
545 record dan data testing berjumlah 137 record data. Hasil menunjukan bahwa algoritma C4.5
mempunyai akurasi prediksi maksimum untuk penentuan status persalinan sebesar 97,08%,
precision 96%, recall 88,89%, F-Measure 92,30%, G-mean 0,0894 dan AUC 0,93995.

Kata kunci : Algoritma C4.5, Data Mining, Pohon Keputusan, Status Persalinan

Abstract

Every parent must be make the best effort for childbirth to go well and be able to deliver the baby
perfectly. The existence of determination of childbirth process becomes important to prepare in
terms of health, and psychology. The process of childbirth in a mother can be taken normally, but
there are often of health factors that make the childbirth by cesarean section. This application is
built to provide advice in determining of childbirth that a pregnant woman should undergo to
improve the safety of mother and baby. Method of data mining application to determine of
childbirth process using C4.5 algorithm. The C4.5 algorithm is selected because it can selects
atributs and is easy to interpret on rules. This application is a combination of information
technology and health field to assist pregnant mother to decided of childbirth as normal or
cesarean section based on maternal and fetal health conditions. Atributs used are age, history of
disease, blood pressure, gravida, birth spacing, cesarean history, fetal distress, placental
abnormality, infant weight, and placenta previa. Medical record data used amounted to 682
records with training data amounted to 545 records and data testing amounted to 137 records data.
The results show that the C4.5 algorithm has maximum predictive accuracy for the determination

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 1


Status Proses Persalinan Menggunakan Algoritma C4.5

of childbirth status 97,08%, precision 96%, recall 88,89%, F-Measure 92,30%, G-mean 0,0894
and AUC 0,93995.

Keywords : C4.5 algorithm, data mining, decision tree, determination of childbirth.

1 PENDAHULUAN proses data mining melalui perangkat lunak


yang membantu pendukung keputusan
1.1 LATAR BELAKANG MASALAH penentuan status proses persalinan dalam
Berdasarkan Survei Demografi dan meningkatkan pelayanan kesehatan serta
Kesehatan Indonesia (SDKI) Tahun 2012 menurunkan resiko angka kematian ibu dan
Angka Kematian Ibu (AKI) di Indonesia bayi. Melalui proses data mining, diharapkan
masih termasuk tinggi yaitu 395 per 100.000 dapat digali suatu potensi yang lebih dari
kelahiran hidup. Upaya penurunan Angka sekedar informasi data rumah sakit saja tetapi
Kematian Bayi (AKB) dan AKI di Indonesia juga dapat menganalisis penentuan status
salah satunya melalui Program Perencanaan proses persalinan kepada seorang ibu dan
Persalinan dan Pencegahan Komplikasi bayinya.
(P4K). Program ini membutuhkan peran Algoritma C4.5 adalah algoritma
keluarga dalam upaya deteksi dini dan klasifikasi data dengan teknik decision tree
menghindari resiko kesehatan pada ibu hamil. yang merupakan perbaikan dari algoritma
Pelaksanaan P4K diharapkan mampu ID3, karena dapat menghilangkan bias pada
membantu keluarga membuat perencanaan data. Kelebihan C4.5 adalah dapat mengolah
persalinan yang baik dan mengambil data dalam jumlah besar, menghasilkan
tindakan yang tepat [1]. aturan – aturan yang mudah
Persalinan merupakan kejadian direpresentasikan dan tercepat diantara
fisiologi yang normal dialami oleh seorang algoritma lainnya dan dapat menangani
ibu berupa pengeluaran hasil konsepsi yang missing data. Pada penelitian ini akan dibahas
hidup dalam uterus melalui vagina kedunia klasifikasi yang dimaksud adalah mengenai
luar yang disebut persalinan normal. penentuan status proses persalinan pada
Beberapa kasus seperti gawat janin, kelainan kehamilan seorang ibu yang diambil dari data
letak janin, tekanan darah, usia ibu, kondisi persalinan pada suatu pusat pelayanan
janin, ukuran pinggul, jarak kelahiran terlalu kesehatan.
dekat dan ukuran janin dapat meningkatkan Berdasarkan permasalahan diatas,
resiko kematian pada ibu dan bayi sehingga maka dapat dikembangkan sebuah teknik
diperlukan alternatif lain dengan aplikasi data mining dalam menentukan
mengeluarkan konsepsi melalui pembuatan status proses persalinan menggunakan
sayatan pada dinding uterus melalui dinding algoritma C4.5 dengan metode decision tree.
perut yang disebut sectio caesaria. Diharapkan dengan adanya perancangan
Seiring dengan perkembangan aplikasi ini dapat mendukung pengambilan
teknologi dan informasi yang sangat cepat, keputusan status proses persalinan pada
pemanfaatan teknologi informasi dapat kehamilan seorang ibu sekaligus membantu
ditemukan pada berbagai bidang, salah merencanakan persalinan untuk tindakan
satunya bidang kesehatan. Melalui data yang tepat ibu hamil untuk meminimalisir
rekam medis persalinan dapat dilakukan

2 Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930


Mariza Putri Sari Dewi Ningsih, Beta Noranita

AKI (Angka Kematian Ibu) dan AKB (Angka provia dan hasil persalinan yang
Kematian Bayi). dilakukan.
1.2 RUMUSAN MASALAH 2. Dari hasil perhitungan didapatkan data
output berupa saran mengenai penentuan
Berdasarkan uraian latar belakang status proses persalinan untuk
yang telah dijelaskan, maka dapat dibuat mendukung persiapan persalinan
rumusan masalah yang dibahas dalam seorang pasien.
penelitian ini adalah bagaimana merancang
dan membangun aplikasi data mining dalam 2 TINJAUAN PUSTAKA
menentukan status proses persalinan
menggunakan algoritma C4.5. 2.1 PENGERTIAN PERSALINAN
1.3 TUJUAN DAN MANFAAT
Persalinan / partus merupakan suatu
Tujuan dari penelitian ini adalah untuk kejadian fisiologi yang memungkinkan
menghasilkan sebuah aplikasi data mining serangkaian perubahan yang besar pada ibu
untuk mentukan status proses persalinan untuk dapat melahirkan janin melalui jalan
yang berfungsi secara baik serta dapat lahir. Persalinan juga merupakan suatu proses
digunakan oleh pengguna umum untuk pengeluaran hasil konsepsi yang dapat hidup,
pendukung keputusan perencanaan dari dalam uterus melalui vagina atau jalan
persalinan. lain ke dunia luar. Kejadian berakhir dengan
Manfaat dilaksanakannya penelitian ini pengeluran bayi yang cukup bulan disusul
adalah: dengan pengeluaran plasenta dan selaput
1. Hasil dari aplikasi dapat digunakan oleh janin [2].
masyarakat umum dan penyedia 2.2 JENIS PERSALINAN
pelayanan kesehatan untuk menjadi
saran bahan pertimbangan dalam Persalinan normal menurut World
perencanaan status proses persalinan Health Organization (WHO) 2010 adalah
kepada ibu hamil. persalinan yang dimulai secara spontan atau
2. Dapat meminimalisir angka kematian dengan kekuatan ibu sendiri dan melalui jalan
ibu (AKI) dan angka kematian bayi lahir, beresiko rendah pada tahap awal
(AKB) setiap tahunnya secara bertahap. persalinan dan persentasi belakang kepala
1.4 RUANG LINGKUP pada usia kehamilan 37-42 minggu dengan
keadaan ibu maupun bayi dalam kondisi [2].
Ruang lingkup pembangunan aplikasi Proses persalinan bantuan terjadi jika
yang akan dikembangkan adalah aplikasi berlangsung dengan bantuan tenaga dari luar
data mining dalam menentukan status misalnya ekstraksi dengan forceps atau
proses persalinan menggunakan algoritma melakukan operasi section caesarea. Operasi
C4.5. caesar adalah operasi pembedahan untuk
1 Data masukan berupa rekam medis melahirkan bayi melalui perut ibu.
persalinan yang terdapat keterangan 2.3 DATA MINING
tekanan darah, kondisi janin, perkiraan
berat janin, posisi bayi, riwayat caesar, Data mining adalah proses menemukan
riwayat penyakit, usia ibu, jarak pola yang menarik dan pengetahuan dari data
kelahiran, urut kehamilan, plasenta yang berjumlah besar [3]. Proses data mining

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 3


Status Proses Persalinan Menggunakan Algoritma C4.5

meliputi tugas preprocessing seperti Langkah berikut untuk menghitung gain,


ekstraksi data, data cleaning, data fusion, rumus dari pada gain adalah sebagai berikut
data reduction, feature construction serta [3]:
𝑣
proses terakhir berupa penemuan model |𝑆𝑗 |
penafsiran yang bersifat cenderung berulang 𝐸𝑛𝑡𝑟𝑜𝑝𝑦𝐴 (𝑆) = ∑
|𝑆|
dan interaktif [4]. 𝑗=1
∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑗 ) … … … (2.2)
𝐺𝑎𝑖𝑛(𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − 𝐸𝑛𝑡𝑟𝑜𝑝𝑦𝐴 (𝑆)
… (2.3)
Proses perhitungan info gain juga dapat
ditulis seperti pada persamaan (2.4) berikut
ini.
𝑣
|𝑆𝑗 |
𝐺𝑎𝑖𝑛(𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) − ∑
|𝑆 |
𝑗=1
∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑗 ) … (2.4)
Gambar 2.1. Tahap Data Mining [3] Keterangan :
Terdapat beberapa macam teknik pada 𝑆 : total kasus
data mining salah satunya adalah 𝐴 : atribut
classification. Classification adalah proses 𝑣 : jumlah partisi atribut 𝐴
untuk menemukan model yang menjelaskan |𝑆𝑗 | : jumlah kasus pada partisi ke-𝑗
kelas data, dengan tujuan untuk dapat |𝑆| : jumlah kasus dalam 𝑆
memperkirakan kelas dari suatu objek yang 2.5 ALGORITMA C4.5
labelnya tidak diketahui. Model tersebut
Algoritma C4.5 mempunyai prinsip kerja
dapat menjadi suatu aturan “jika-maka”
berupa decision tree. Proses klasifikasi yang sama dengan ID3. Hanya saja dalam
algoritma C4.5 proses pemilihan atribut
biasanya dibagi menjadi dua fase, yaitu
learning dan testing. dilakukan dengan menggunakan gain ratio
dengan rumus yang ditunjukan pada
2.4 DECISION TREE
persamaan 2.5 [3].
Decision tree merupakan himpunan
𝐺𝑎𝑖𝑛𝑅𝑎𝑡𝑖𝑜 (𝐴, 𝐷 )
kemungkinan yang membentuk jika maka (If
𝐺𝑎𝑖𝑛(𝐴)
– Then). Entropy digunakan untuk = … … … … (2.5)
𝑆𝑝𝑙𝑖𝑡𝐼𝑛𝑓𝑜𝐴 (𝐷)
menentukan yang manakah node yang akan
𝑆𝑝𝑙𝑖𝑡𝐼𝑛𝑓𝑜𝐴 (𝐷 )
menjadi pemecah data latih berikutnya. 𝑣
𝑚 |𝑆𝑗 | |𝑆𝑗 |
= −∑ ∗ 𝑙𝑜𝑔2 … … … (2.6)
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = − ∑(𝑝𝑖 |𝑆| |𝑆 |
𝑗=1
𝑖=1
Keterangan:
∗ 𝑙𝑜𝑔2 𝑝𝑖 ) … … … … (2.1)
𝐴 : atribut
Keterangan :
𝑣 : jumlah partisi atribut 𝐴
𝑆 : total kasus
𝑚 : jumlah partisi 𝑆 |𝑆𝑗 | : jumlah kasus pada partisi ke-𝑗
𝑝𝑖 : probabilitas dari 𝑆𝑖 terhadap 𝑆, dengan 𝑆𝑖 |𝑆| : jumlah total kasus
adalah jumlah kasus partisi ke-𝑖

4 Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930


Mariza Putri Sari Dewi Ningsih, Beta Noranita

Secara umum Algoritma C4.5 untuk dapat menggunakan metrik TPrate/recall


membangun pohon keputusan adalah [5]: (sensitivitas). G-Mean dan AUC merupakan
1. Memilih atribut sebagai akar evaluasi prediktor yang lebih komprehensif
2. Membuat cabang (simpul internal) untuk dalam konteks ketidakseimbangan [6].
masing-masing nilai 𝐹 − 𝑀𝑒𝑎𝑠𝑢𝑟𝑒
3. Membagi kasus dalam cabang 2 ∗ 𝑅𝑒𝑐𝑎𝑙𝑙 ∗ 𝑃𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛
=( ) … … … … … … (2.10)
4. Mengulangi proses masing-masing 𝑅𝑒𝑐𝑎𝑙𝑙 + 𝑃𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛
cabang hingga semua kasus pada cabang 𝐺 − 𝑀𝑒𝑎𝑛
memiliki kelas yang sama. Atribut yang = (√𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 ∗ 𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦) … … … … … (2.11)
telah dipilih dan memiliki kelas tidak 𝑆𝑒𝑛𝑠𝑖𝑡𝑖𝑣𝑖𝑡𝑦 (𝑇𝑃𝑅 )
diikutkan lagi dalam perhitungan nilai 𝑇𝑃
pemilihan atribut akar. =( ) … … … … (2.12)
𝑇𝑃 + 𝐹𝑁
Setelah proses dijalankan maka akan 𝑆𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑡𝑦 (𝐹𝑃𝑅 )
menghasilkan decision tree lalu membentuk 𝐹𝑃
=( ) … … … … (2.13)
suatu rule. Melalui rule yang terbentuk dapat 𝑇𝑁 + 𝐹𝑃
menentukan aturan keputusan. AUC memberikan ukuran skalar dari
2.6 PENGUKURAN KINERJA kinerja pengklasifikasi dan telah banyak
digunakan dalam domain yang tidak
Terdapat beberapa istilah yang seimbang. Ukuran AUC dihitung sebagai
digunakan pada perhitungan pengukuran luas daerah kurva ROC menggunakan
kinerja. Proses ini akan mempermudah untuk persamaan [7]:
memahami berbagai langkah. 𝐴𝑟𝑒𝑎 𝑈𝑛𝑑𝑒𝑟 𝐶𝑢𝑟𝑣𝑒 (AUC))
Tabel 2.1. Confusion Matriks 1 + 𝑇𝑃𝑟𝑎𝑡𝑒 − 𝐹𝑃𝑟𝑎𝑡𝑒
=( ) … … … … (2.14)
2
Menurut Gorunescu analisis hasil
klasifikasi data mining, nilai AUC dapat
dibagi menjadi beberapa kelompok [8].
𝑃𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛
𝑇𝑃 a. 0.90-1.00 = klasifikasi sangat baik
=( ) … … … … … … … … (2.7) b. 0.80-0.90 = klasifikasi baik
𝑇𝑃 + 𝐹𝑃
𝑇𝑃 c. 0.70-0.80 = klasifikasi cukup
𝑅𝑒𝑐𝑎𝑙𝑙 =( ) d. 0.60-0.70 = klasifikasi buruk
𝑇𝑃 + 𝐹𝑁
𝑇𝑃 e. 0.50-0.60 = klasifikasi salah
= ( ) … … … … … (2.8)
𝑃 Receiver operating characteristic (ROC)
𝑇𝑃 + 𝑇𝑁 adalah kurva menggambarkan alur dari true
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ( )
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁 positive rate (TPR) terhadap false positive
𝑇𝑃 + 𝑇𝑁 rate (FPR). Secara teknis kurva ROC adalah
=( ) … … … … … … … … (2.9)
𝑃+𝑁 grafik dua dimensi dimana tingkat TP di plot
Menurut (Zhang & Wang, 2011) pada pada sumbu Y dan tingkat FP di plot pada
data tidak seimbang, akurasi lebih didominasi sumbu X.
oleh ketepatan pada data kelas minoritas.
Sehingga metrik yang tepat adalah AUC
3 ANALISIS DAN PERANCANGAN
(Area Under the ROC Curve), F-Measure, G-
Mean, akurasi keseluruhan, dan akurasi untuk 3.1 DESKRIPSI PERANGKAT LUNAK
kelas minoritas. Akurasi kelas minoritas

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 5


Status Proses Persalinan Menggunakan Algoritma C4.5

Aplikasi data mining dalam menentukan Tabel 3.1. Nilai Kondisi Normal Atribut
status proses persalinan menggunakan

Keteran

Normal
Atribut

Atribut
Nama

Satuan

Nilai
No.

gan
algoritma C4.5 mengambil studi kasus di
Puskesmas Kecamatan Grogol Petamburan
Jakarta dan Bidan Lucia Wongso Jakarta.
Usia seorang Tahu 18 -

Usia
ibu
Aplikasi ini akan digunakan oleh 1.
ibu n 35
masyarakat umum dan administrator. Admin

Keteranga
n Atribut
adalah pengguna yang dapat mengelola dan

Normal
Atribut
Nama

Satuan

Nilai
No.
memasukan data pengujian kedalam
database. Data yang telah dimasukan oleh
admin akan dilanjutkan dengan
Tahun

Kelahira
menggunakan algoritma C4.5. Dari data Tahu

Jarak
2. terakhir ibu 2

n
pengujian ini akan menghasilkan rule yang n
akan digunakan pada penentuan status melahirkan
persalinan. Pengguna lainnya yaitu Riwayat
masyarakat umum dapat memasukan data penyakit
sesuai dengan rekam medis pasien tersebut berat kelainan
kedalam aplikasi, akan dicocokan dengan jantung,
Riwayat Penyakit

rule yang telah terbentuk. Hasil akhirnya tuberkolosis,


yaitu pengguna umum tersebut akan kelainan
mendapatkan saran hasil status proses 3. ginjal, - -
persalinan sesuai dengan rekam medis yang kencing
dimasukan. manis,
3.2 PENGUMPULAN DATA anemia,
kelainan
Data penelitian yang diambil adalah data darah, TBC,
yang telah menjalani persalinan dengan dan lain - lain
rentang kehamilan 36 – 41 minggu. Proses
Tekanan
persalinan yang diambil adalah dengan
darah ibu
Tekanan
Darah

kelahiran selamat sebanyak berjumlah 682 mm Norm


4. hamil saat
data. Berdasarkan 10 atribut yang telah Hg al
pengecekan
memenuhi kriteria yaitu, usia ibu, riwayat
terakhir
penyakit ibu, tekanan darah, banyak
Urutan hamil
kelahiran, tahun terakhir, riwayat caesar,
diakhiri janin
Kelahiran

gawat janin, kelainan letak, berat bayi, dan Kela


Banyak

lahir dan telah


plasenta proveria. 5. hira 1-3
memenuhi
Penentuan kategori-kategori didapatkan n
syarat
berdasarkan dari hasil wawancara dengan
kehidupan.
bidan selaku tenaga kesehatan dan buku
kesehatan Survei Demografi dan Kesehatan
Indonesia (SDKI) Tahun 2002 - 2003 yang
relevan dengan kategori.

6 Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930


Mariza Putri Sari Dewi Ningsih, Beta Noranita

Riwayat Usia Ibu 18<= Umur Normal

Riwayat Caesar
5.
caesar yang <=35
dimiliki ibu Usia Ibu Umur > Lanjut
6. - - 6.
saat 35
kehamilan Gawat - Ya
7.
sebelumnya Janin
Kondisi bayi Gawat - Tidak
8.
gawat janin Janin
Gawat Janin

jika Berat 2500 < BB Kecil


9.
7. kekurangan - - Bayi
oksigen atau Berat 2500 <= BB Normal
10.
komplikasi Bayi <= 4000
lainnya Berat BB > 4000 Besar
Kondisi letak 11.
Bayi
Posisi
Bayi

8. bayi normal - - Posisi - Normal


atau sungsang 12.
Bayi
Kondisi berat Posisi - Sungsan
13.
Berat

bayi melalui gram 2500 -


Bayi

9. Bayi g
ultrasonograf (gr) 4000 14. Banyak 1–3 Cukup
i Kelahira
Kelainan n
Plasenta Proveria

posisi janin 15. Banyak Kelahiran >= Banyak


pada rahim Kelahira 4
1
bagian - - n
0
bawah, 16. Jarak Jarak < 2 Dekat
menutupi Kelahira
jalan lahir n
Berdasarkan nilai referensi diatas maka 17. Jarak Jarak >= 2 Normal
terbentuk 23 kategori yang akan disesuaikan Kelahira
dengan data yang diproses. Kategori data n
persalinan dapat dilihat pada Tabel 3.2. 18. Riwayat - Ya
Tabel 3.2. Tabel Kategori Atribut
Caesar
No Nilai
Atribut Kategori 19. Riwayat - Tidak
. Kontinyu
Caesar
1. Tekanan TD < Normal Rendah
20. Riwayat - Ya
Darah
Penyakit
Tekanan Normal <= Normal
21. Riwayat - Tidak
2. Darah TD <=
Penyakit
Normal
22. Plasenta - Ya
Tekanan TD > 120/80 Tinggi
3. Proveria
Darah
23. Plasenta - Tidak
4. Usia Ibu Umur < 18 Dini
Proveria

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 7


Status Proses Persalinan Menggunakan Algoritma C4.5

3.3 TAHAPAN DATA MNING

Analisis untuk mengolah data hingga


siap digunakan harus melalui beberapa tahap
perancangan data mining terlebih dahulu.
1. Pembersihan Data (Cleanning)
Melalui sejumlah data yang dikumpulkan
terdapat beberapa data yang memiliki field
kosong sehingga tidak akan digunakan.
Selanjutnya data yang tidak relevan seperti
jenis kelamin dan jumlah abortus tidak
akan menjadi parameter atribut yang
digunakan.
2. Integrasi Data (Integration)
Melalui kedua tempat ini akan
digabungkan dari masing-masing basis
datanya, menjadi data rekam medis yang Gambar 3.1. Flowchart Algoritma C4.5
dibutuhkan.
3. Seleksi Data (Selection) 3.5 ANALISIS PROGRAM ALGORITMA
Pada basis data tidak seluruhnya data
Sub aplikasi Algoritma C4.5 memiliki
digunakan, maka hanya data yang sesuai
beberapa langkah sebagai berikut.
untuk analisis yang akan seleksi.
1. Menentukan data yang dipakai pada saat
4. Transformasi Data (Transformation)
pelatihan. Transformasi data dengan
Transformasi data akan dikatgeorikan
kategori atribut berdasarkan dari nilai
sesuai dengan katgeori yang telah
kategori yang telah ditentukan
ditentukan pada Tabel 3.2.
2. Perhitungan Entropy
5. Aplikasi Teknik Data Mining
Berikut merupakan hasil realisasi untuk
Proses mining menggunakan metode
perhitungan nilai entropy total. Masing-
decision tree dengan algoritma C4.5.
masing total kasus diambil dari penerapan
6. Evaluasi Pola dan Persentasi Pengetahuan
atribut data latih.
Pada tahap ini akan melihat apakah model
Total Kasus PersalinanNormal = 427
yang telah terbentuk seperti pohon
Total Kasus PersalinanCaesar = 118
keputusan dan aturan (rule) sesuai atau
Total Kasus = 545
tidak mendekati hasil yang diberikan oleh
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑠𝑒𝑚𝑢𝑎) = 0,7538
ahli kebidanan / kandungan.
427 427 118
3.4 PERANCANGAN ALGORITMA = ((− ) ∗ 𝑙𝑜𝑔2 ( ) + (− )
545 545 545
Tahapan flowchart algoritma dari 118
∗ 𝑙𝑜𝑔2 ( ))
metode Decision Tree Algoritma C4.5 pada 545
proses penentu status persalinan.
Perhitungan entropy atribut untuk
perhitungan nilai kategori atribut
tekanan darah normal. Masing-masing

8 Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930


Mariza Putri Sari Dewi Ningsih, Beta Noranita

total kasus diambil dari penerapan atribut 529 529 8 8


data latih. ((− ) ∗ 𝑙𝑜𝑔2 ( ) + (− ) ∗ 𝑙𝑜𝑔2 ( )
545 545 545 545
Total Kasus PersalinanNormal|TD=Normal
= 426 8 8
+ (− ) ∗ 𝑙𝑜𝑔2 ( ))
Total Kasus PersalinanCaesar|TD=Normal 545 545
= 103 5. Perhitungan Gain Ratio
Total Kasus Kat_Atribut TD=Normal Bentuk perhitungan gain ratio dari
= 529 tekanan darah pada data rekam medis
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑡𝑑, 𝑛𝑜𝑟𝑚𝑎𝑙 ) = 0,7112 adalah sebagai berikut:
426 426 103 Hasil Gain (S, TD) =
= ((− ) ∗ 𝑙𝑜𝑔2 ( ) + (− ) 0,0554
529 529 529
103 Hasil SplitInfo (S, TD) = 0,2205
∗ 𝑙𝑜𝑔2 ( )) 𝐺𝑎𝑖𝑛𝑅𝑎𝑡𝑖𝑜 (𝑠𝑒𝑚𝑢𝑎, 𝑡𝑒𝑘𝑎𝑛𝑎𝑛_𝑑𝑎𝑟𝑎ℎ)
529
0,0554
3. Perhitungan Info Gain = = 0,2514
0,2205
Perhitungan nilai gain atribut pada data
6. Proses perhitungan entropy, gain,
rekam medis pasien yang diproses
splitinfo, dan gainratio dilakukan pada
dijabarkan dengan contoh pada nilai
semua atribut.
atribut “tekanan darah” yang memiliki
7. Pilih atribut sebagai akar dengan gain
kategori ‘rendah’, ‘normal’, ‘tinggi’. Pada
ratio tertinggi akan dipilih sebagai
proses perhitungan gain, nilai entropy dari
simpul. Atribut ‘riwayat penyakit’
setiap kategori atribut harus diketahui.
memiliki gain ratio tertinggi akan dipilih
Total Tekanan_DarahTinggi = 8
sebagai root pada decision tree yang
Total Tekanan_DarahRendah =8
dibangun.
Total Tekanan_DarahNormal= 529
8. Buat cabang masing-masing nilai.
Hasil Entropy TDRendah =0
Hasil Entropy TDNormal = Tabel 3.3. Jumlah Kasus Riwayat Penyakit
0,7112 Kasu Caes Nom
Jenis
Hasil Entropy TDTinggi = s ar al
0,5436 Riway Ya 26 26 0
𝐺𝑎𝑖𝑛 (𝑠𝑒𝑚𝑢𝑎, 𝑡𝑒𝑘𝑎𝑛𝑎𝑛𝑑𝑎𝑟𝑎ℎ) = 0,0554 at
Tida
8 Penyak 519 92 427
= (0,7538 − ( ∗ 0) k
545 it
Pada atribut (Riwayat Penyakit = Ya)
529
+( ∗ 0,7112) memiliki jumlah kasus caesar 26 kasus
545
dan normal 0 kasus, atribut (Riwayat
8
+( ∗ 0,5436)) Penyakit = Ya) memiliki keputusan kelas
545
caesar. Selanjutnya pada atribut
4. Pehitungan SplitInfo (Riwayat Penyakit = Tidak) memiliki
Nilai splitinfo atribut yang dihitung jumlah kasus caesar 92 kasus dan normal
penerapannya adalah untuk tekanan 427 kasus, sehingga belum mendapatkan
darah. keputusan kelas dan masih perlu
𝑆𝑝𝑙𝑖𝑡𝐼𝑛𝑓𝑜 (𝑠𝑒𝑚𝑢𝑎, 𝑡𝑒𝑘𝑎𝑛𝑎𝑛𝑑𝑎𝑟𝑎ℎ) dilakukan perhitungan selanjutnya. Pada
= 0,2205

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 9


Status Proses Persalinan Menggunakan Algoritma C4.5

atribut (Riwayat Penyakit = Tidak) akan


dipilih suatu subnode menjadi cabang.
Hasil pembentukan decision tree
dapat dilihat pada gambar 3.1.

Gambar 3.4. Rancangan Hasil Persalinan


Gambar 3.2. Decision Tree Pemilihan Root
Setelah didapatkan suatu keputusan pada 4 IMPLEMENTASI
pohon maka akan membentuk suatu
aturan dari pohon yang telah terbentuk. 4.1 HASIL TAMPILAN SISTEM
Rule :
Pada tahap ini merupakan implemetasi
IF r_penyakit = ya THEN keputusan =
caesar antarmuka yaitu halaman hasil saran
persalinan pada gambar 4.1.
9. Bagi kasus dalam cabang. Pemisahan
data yang dilakukan berdasarkan
perhitungan sebelumnya. Sehingga
seluruh data yang memiliki atribut
(Riwayat Penyakit = Ya) tidak akan
masuk pada perhitungan. Jadi hanya
atribut dengan kategori (Riwayat
Penyakit = Tidak) yang akan masuk pada
perhitungan iterasi selanjutnya.
10. Ulangi untuk masing-masing cabang.
Proses perulangan dilakukan dari
perhitungan nilai entropy, gain, splitinfo, Gambar 4.1. Hasil APSALIN
dan gainratio sampai semua kasus pada 4.2. HASIL PENGKURAN KINERJA
cabang memiliki kelas yang sama.
Pada pengujian kebenaran aplikasi,
dicoba dengan beberapa data rekam medis uji
sebanyak 317 data. Perhitungan nilai akan
diambil kasus caesar menjadi actual class.
Kelas caesar menjadi kelas positif karena
lebih dipentingkan oleh sistem harus dapat
tepat mendeteksi pemberian kelas caesar.
Tabel 4.1. Confusion Matriks Pengukuran
Gambar 3.3. Hasil Pohon Asli
Tota
3.6 PERANCANGAN ANTARMUKA Caesar Caesa Norma
l
r l
Rancangan antarmuka akan digunakan Prediks TP FP
sebagai gambaran kepada perancang aplikasi Caesar 25
i 24 1
dalam membentuk hasil saran persalinan.

10 Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930


Mariza Putri Sari Dewi Ningsih, Beta Noranita

Norma FN TN Melalui pengujian seluruh fungsi dapat


112
l 3 109 dilihat bahwa pengujian seluruh fungsi
Total 27 110 137 telah diterima.
Tabel 4.2. Hasil Akurasi C4.5 2. Pada aplikasi ini menggunakan 682
Pengukuran Nilai record dengan data training berjumlah
Akurasi (%) 97,0803 545 record dan data testing berjumlah
Precision 0,96 137 record data. Melalui data testing
Recall 0,8889 yang diujikan terdapat empat data testing
F-Measure 0,9230 dengan hasil berbeda dari keputusan asli.
Sensitivity (TPR) 0,8889 3. Pada aplikasi penentuan status proses
Specificity (FPR) 0,0090 persalinan dengan Algoritma C4.5
G-Mean 0,0894 memiliki tingkat accruracy sebesar
AUC 0,9399 97,08%, nilai rata-rata precision 96%,
AUC (Area Under the ROC Curve) recall 88,89%, F-Measure 92,30%, G-
adalah ukuran kinerja yang populer dalam mean 0,0894 dan AUC 0,93995. Tingkat
ketidakseimbangan kelas, nilai AUC yang akurasi dapat berubah tergantung dengan
tinggi menunjukkan perbedaan kinerja model data pelatihan dan data uji yang
yang lebih baik. digunakan pada proses berjalan.
Pengukuran AUC menurut Gorunescu Hasil dari aplikasi data mining dalam
analisis hasil klasifikasi data mining, nilai menentukan status proses persalinan dengan
AUC dapat dibagi menjadi beberapa menggunakan Algoritma C4.5 ini dapat
kelompok. Hasil algoritma C4.5 termasuk dijadikan sebuah bahan pertimbangan untuk
klasifikasi sangat baik karena memiliki nilai pengguna umum dalam menentukan proses
AUC yang berada pada rentang 0.90-1.00. persalinan yang akan dijalani.
5.2 SARAN

Saran yang dapat diberikan untuk


penelitian selanjutnya adalah dapat
dikembangan terkait variabel yang
Gambar 4.2. Kurva ROC C4.5 digunakan, sehingga dapat menganalisis
kesehatan pengguna umum secara lebih
5 PENUTUPAN mendalam.
5.1 KESIMPULAN 5.3 DAFTAR PUSTAKA

Berdasarkan hasil analisis dan [1] T. Kementrian Kesehatan, Info DATIN


pengujian yang telah dilakukan pada Tugas (Pusat Data dan Informasi Kemetrian
Akhir ini, maka dapat diambil beberapa Kesehatan), Jakarta: Kemetrian
kesimpulan, diantaranya: Kesehatan, 2014.
1. Telah dibangun aplikasi data mining
untuk prediksi penentuan status proses [2] I. P. Damayanti and dkk, Buku Ajar
persalinan menggunakan algoritma C4.5. Asuhan Kebidanan Komprehensif Pada
Melalui fungsi aplikasi yang telah Ibu Bersalinan dan Bayi Baru Lahir,
berjalan sesuai kebutuhan yang Yogyakarta: Deepublish, 2014.
didefinisikan pada analisis kebutuhan.

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 11


Status Proses Persalinan Menggunakan Algoritma C4.5

[3] J. Han, M. Kamber and J. Pei, Data


Mining Concept and Teqniques Third
Edition, San Francisco: Morgan
Kaufmann, 2012.

[4] M. J. Zaki, Data Mining and Analysis


(Fundamental Konsep and Algorithms,
New York: Cambridge University, 2014.

[5] S. P. Utari, "Implementasi Metode C4.5


Untuk Menentukan Guru," Pelita
Informatika Budi Darma, pp. Volume :
IX, Nomor: 3, 2015.

[6] A. Saifudin and R. S. Wahono,


"Penerapan Teknik Ensemble untuk
Menangani Ketidakseimbangan,"
Journal of Software Engineering, Vol. 1,
No. 1, April 2015, pp. 28-37, 2015.

[7] M. Galar, A. Fernández, E. Barrenechea


and F. Herrera, "EUSBoost: Enhancing
ensembles for highly imbalanced data-
sets by evolutionary undersampling,"
Pattern Recognition, pp. 3460-3471,
2013.

[8] F. Gorunescu, Data Mining: Concepts,


Model, and Techniques Vol. 12, Berlin:
Springer, 2011.

12 Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930


LAMPIRAN 1. HASIL PERHITUNGAN ITERASI PERTAMA

Jenis Kasus Caesar Normal Entropy Gain Split Gain


Info Ratio
Total 545 118 427 0,7538 -
Tekanan Normal 529 103 426 0.7112
Darah Rendah 8 8 0 0 0,0554 0,2205 0,2514
Tinggi 8 7 1 0.5436
Berat Bayi Besar 18 18 0 0
Kecil 29 11 18 0.9576 0,0839 0,5066 0,1657
Normal 498 89 409 0.6773
Gawat Tidak 536 109 427 0,7286
0,0372 0,1214 0,3064
Janin Ya 9 9 0 0
Posisi Bayi Normal 533 106 427 0,7197
0,0499 0,1526 0,3271
Sungsang 12 12 0 0
Riwayat Ya 26 26 0 0
0,1119 0,2766 0,4044
Penyakit Tidak 519 92 427 0,6741
Usia Muda 9 4 5 0,9911
Ideal 494 80 414 0,6389 0,1041 0,5112 0,2036
Tua 42 34 8 0,7025
Riwayat Ya 3 3 0 0
0,0122 0,0492 0,2484
Proveria Tidak 542 115 427 0,7456
Jarak Dekat 25 20 5 0.7219
0,0544 0,2686 0,2026
Kelahiran Normal 520 98 422 0.6982
Riwayat Ya 24 24 0 0
0,1027 0,2605 0,3944
Caesar Tidak 521 94 427 0,6810
Urut Hamil Normal 492 89 403 0.6820
0,0414 0,4602 0,0900
Banyak 53 29 24 0.9936

Jurnal Masyarakat Informatika, Volume 9, Nomor 1, ISSN 2086 – 4930 13

Anda mungkin juga menyukai