Dari Tabel 1 diatas dapat dibuat atribut-atribut Penerapan model dengan data baru untuk
sebagaimana Tabel 2 berikut menghasilkan perkiraan dari kasus yang ada
Ada banyak model dalam data mining, antara lain
Tabel 2. Atribut classification dan clustering. Penelitian ini
Atribut Keterangan Nilai menggunakan model klasifikasi dengan pohon
IMT Status Gizi Kurus, keputusan menggunakan konsep gain dan entrophy
Normal, atau yang juga dikenal dengan Algoritma C4.5
Gemuk
Pola Konsumsi bahan Tidak
makan_1 makanan yang pernah, 2.3 Pohon Keputusan (Decision Tree)
berisiko gejala jarang, Pohon keputusan menurut merupakan
GERD sering representasi dukungan keputusan yang diberikan
secara grafis. Kegunaannya Permasalahan yang
Pola Konsumsi bahan Tidak
makan_2 didekati dengan pohon keputusan bersifat saling
makanan yang pernah,
bebas antara satu kejadian dengan kejadian yang
meningkatkan jarang, lainnya. Pohon keputusan memiliki empat
sekresi asam sering komponen utama, yaitu: akar (root), node, daun
lambung (leaf), dan busur (arc). Akar merupakan kejadian
Pola Konsumsi bahan Tidak awal dimana proses penelusuran dimulai [10]. Node
makan_3 makanan yang pernah, menunjukkan menunjukkan suatu atribut tertentu
menimbulkan rasa jarang, yang akan diuji kebenarannya. Daun menunjukkan
nyeri & iritasi pada sering klasifikasi, yaitu hasil yang akan diuji kebenarannya.
esofagis Daun menunjukkan klasifikasi, yaitu hasil yang
Gaya Rata-rata frekuensi Tidak diberikan setelah proses penelusuran. Busur dengan
hidup perilaku/kebiasaan pernah, anak panah menunjukkan arah penelusuran [10].
yang dapat jarang, Pohon keputusan dapat digunakan untuk
menimbulkan sering merepresentasikan aturan-aturan pengklasifikasian
gejala GERD (classification rule). Pada aturan klasifikasi dikenal
Risiko Resiko GERD Rendah, istilah antesenden dan dan konsekuen. Antesenden
Sedang, adalah fakta yang didapat dari serangkaian hasil
Tinggi pengujian terhadap sekumpulan kejadian sedangkan
konsekuen adalah merupakan konklusi dari
antesenden yang diberikan. Pada penelitian ini,
2.2 Data Mining aturan yang diaplikasikan adalah aturan IF-THEN.
Data mining menurut David Hand, Heikki Pada aturan ini, antesenden terletak setelah IF
Manilla, dan Padhraic Smyth adalah analisa terhadap seda.ngkan konsekuen terletak setelah THEN.
data (biasanya data yang berukuran besar) untuk
menemukan hubungan yang jelas serta
menyimpulkan yang belum diketahui sebelumnya 2.4 Pohon Keputusan dengan Konsep Entropy
dengan cara terkini yang dipahami dan berguna bagi Urutan kemunculan sebuah atribut perlu
pemilik data tersebut [8]. dipertimbangkan dalam membuat sebuah pohon
Definis lain menyebutkan bahwa Data keputusan. Pemilihan sebuah node menjadi akar dan
mining adalah eksplorasi dan analisis data yang node mana yang akan menjadi alternatif atribut
berukuran besar untuk menemukan pola data yang berikutnya akan mempengaruhi efisiensi waktu
valid, novel, understandable dan memiliki potensi penelusuran [10]. Penentuan urutan atribut dapat
untuk dimanfaatkan (useful) [9]. Valid yaitu pola dilakukan dengan menggunakan konsep entropy
berlaku secara umum. Novel berarti pola tersebut dengan memanfaatkan information gain [10].
tidak diketahui atau dikenali sebelumnya. Dengan konsep ini, selain akan menentukan posisi
Understandable artinya dapat menginterpretasi dan atribut mana yang akan dijadikan akar, juga akan
memahami pola yang diperoleh. Useful berarti kita mengeliminasi beberapa atribut yang kurang
dapat merancang tindakan apa saja yang dapat memberikan kontribusi dalam pembentukan basis
dilakukan berdasarkan pola tersebut [9]. pengetahuan. Tahapan pembentukan pohon
Secara skematis, menurut Gorunescu keputusan dengan konsep entropy adalah sebagai
(2011) aktivitas data mining dapat dilaksanakan berikut :
dalam tiga aktivitas, yaitu [8] :
Eksplorasi data : pembersihan data, transformasi 1. Hitung jumlah data untuk setiap klasifikasi
data, pengurangan dimensi, pemilihan ciri, dll 2. Tentukan atribut akar pohon.
Untuk menentukan atribut akar didasarkan pada
Membuat model dan melakukan pengujian
nilai Gain tertinggi dari atribut-atribut yang ada
terhadap validitas model untuk memilih model
dengan persamaan
mana yang cocok dengan kasus yang dihadapi.
( ) ( ) Sering 3 2 1 0 0,000
( ) (1) Tidak
Dimana : Pernah 2 1 1 0 0,000
– S: simpul acuan
PM3 0,904
– A: atribut Jarang 5 2 1 2 0,960
– n: jumlah partisi atribut A
– |Si|: jumlah kasus pada partisi ke-i Sering 2 0 1 1 0,000
– |S|: jumlah kasus dalam S
Entropy dicari dengan Tidak
( ) ∑ (2) Pernah 2 1 1 0 0,000
Dimana GH 0,862
– pi: proporsi dari Si terhadap S Jarang 7 2 3 2 0,982
– Log2 pi = log pi / log 2
3. Buat cabang untuk setiap nilai atribut Sering 2 0 0 2 0,000
4. Bagi kasus untuk setiap cabang.
5. Ulangi proses 3-4 untuk setiap cabang sampai
semua kasus pada cabang memiliki kelas yang
sama Dari Tabel 3 diatas nilai gain yang paling
tinggi adalah atribut PM1 (pola makan tipe 1).
Dilihat dari nilai entrophy yang paling besar maka
Untuk kasus diatas, misalkan setelah yang menjadi cabang adalah partisi JARANG
dilakukan klasifikasi tingkat risiko penyakit GERD dengan kelas risiko TINGGI dan partisi SERING
dari 50 kasus pasien yang telah didiagnosa dengan kelas risiko TINGGI, sedangkan partisi
sebeumnya menjadi kelas rendah (tingkat risiko TIDAK PERNAH harus dipecah lagi ke level dua
rendah), kelas sedang (untuk risiko sedang), dan untuk menentukan cabang selanjutnya. Gambar
kelas tinggi (untuk risiko tinggi) didapat perhitungan pohon pada level satu adalah sebagaimana terlihat
gain dan entrophy pada level 1 untuk menentukan pada Gambar 1 berikut
manakah atribut yang akan menjadi akar pohon.
Apakah atribut status gizi (IMT), pola makan tipe 1
(PM1), pola makan tipe 2 (PM2), pola makan tipe 3
(PM3), atau gaya hidup (GH). Misalkan hasilnya
adalah sebagaimana tersaji pada Tabel 3 berikut :
PM1 0,924
Umur Number 3 Umur pasien
Jarang 3 2 1 0 0,000
Gambar. 2. Rancangan antarmuka login penelusuran (jika ada). Dari pohon tersebut akan
diketahui rule (aturan) dari penelusuran pohon.
5.2 Rancangan Antarmuka Kuesioner
Antarmuka kuesioner dirancang untuk
memasukkan data pasien GERD dan memberikan
penilaian terhadap pertanyaan-pertanyaan kuesioner
yang berhubungan dengan gaya hidup, pola makan,
dan status gizi pasien.
Penelitian ini adalah sebuah rangangan [6] Nobutake Yamamichi dkk. (2012). Lifestyle factors
aplikasi yang dibangun untuk membantu affecting gastroesophageal reflux disease symptoms:
tenaga medis dalam menganalisa tingkat risiko a cross-sectional study of healthy 19864 adults using
seorang pasien GERD. Hal ini bertujuan FSSG scores. http://www.biomedcentral.com/1741-
membantu mereka dalam menganalisa tingkat 7015/10/45/. Diakses tanggal 2 Juni 2014
keparahan seorang pasien GERD atau dapat
juga untuk mengetahui apakah seseorang [7] Bertolini S dkk. (2013).Entropy-driven decision tree
beresiko terkena GERD atau tidak dilihat dari building for decision support in gastroenterology.
pola makan, gaya hidup, dan status gizinya. http://www.ncbi.nlm.nih.gov/pubmed/17420944.
Proses penentuan risiko dilakukan dengn Diakses tanggal 4 Juni 2014
konsep data mining dimana sekumpulan data
pasien GERD yang telah melalui proses [8] Prabowo P Widodo, dkk. (2013). Penerapan Data
diagnosa oleh dokter diuji dengan metode Mining Dengan Matlab. Rekayasa Sains. Bandung
entrophy untuk membentuk pohon keputusan.
Aturan yang diperoleh dari penelusuran [9] Sri Kusumadewi dan Lizda Iswari. (2013). Bahan
digunakan untuk menentukan tingkat risiko Kuliah SPK Datamining
seseorang yang didiagnosa GERD selanjutnya.
Penelitian ini merupakan sebuah studi awal [10 Sri Kusumadewi dkk. (2009). Informatika Kesehatan.
yang dapat dikembangkan dengan ] Graha Ilmu. Jogjakarta
menggunakan metode klasifikasi data mining
yang lain seperti dengan Naive Bayes atau K-
Nearest Neighbour. Dapat juga dilakukan
klustering dengan menggunakan konsep fuzzy DAFTAR RIWAYAT HIDUP PENULIS
seperti fuzzy c mean atau fuzzy subtractive.
Nama : Hambali Furnawan, ST.
TTL : Palembang, 20 Juli 1978
7. REFERENSI NIDN : 1020077802
Pend. Terakhir : S1 (Teknik Informatika
[1] Sarwono Waspadji dkk. (2010). Pengkajian status gizi: UII Yogyakarta)
Studi epidemologi dan Penelitian Rumah sakit EdisiBidang Keahlian : Sistem Cerdas
Kedua. Pusat Diabetes dan Lipid, RSCM/FKUI danJab. Fungsional : Asisten Ahli
Instalasi Gizi RSCM. Jakarta.
[2] Tiantian Chen, dkk. (2012). Prevalence and risk factorsNama : Sukma Puspitorini, ST.
of gastroesophageal reflux symptoms in a ChineseTTL : Blora, 01 April 1982
retiree cohort. http://www.biomedcentral.com/1471-NIDN : 1001048201
230X/12/161. Diakses tanggal 7 Juni 2014 Pend. Terakhir
: S1 (Teknik Informatika
UII Yogyakarta)
[3] Horowitz N dkk.(2007). Applying data miningBidang Keahlian : Sistem Cerdas
techniques in the development of a diagnosticsJab. Fungsional : Asisten Ahli
questionnaire for GERD.
http://europepmc.org/abstract/med/23542975.
Diakses tanggal 2 Juni 2014.