Data Mining PDF

PENGOLAHAN BASIS DATA UNTUK PEMILIHAN
KONTAK LENSA PAS MENGGUNAKAN METODE

KLASIFIKASI DAN ALGORITMA C45
MAKALAH
UJIAN AKHIR SEMESTER
Diajukan untuk memenuhi mata kuliah Proses Data Mining pada Program Strata
Satu (S1)
Denti Yusniar 11152380

Septia Rahayu 11152953
Novi Asnonik 11152852
Agnesta B.R. Tarigan 11152842
Nurtias J.R. 11152851
Program Studi Sistem Informasi

Sekolah Tinggi Manajemen Informatika & Komputer Nusa Mandiri
Jakarta
2018
KATA PENGANTAR
Puji syukur alhamdullillah penulis panjatkan kehadirat Allah SWT, yang telah
melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penulis dapat
menyelesaikan tugas ini dengan baik. Dimana makalah ini penulis sajikan dalam
bentuk makalah yang sederhana. Adapun judul makalah yang penulis ambil
sebagai berikut, “ Pengolahan Basis Data Untuk Pemilihan Kontak Lensa Pas
Menggunakan Metode Klasifikasi dan Algoritma C45”.
Tujuan penulisan makalah ini dibuat sebagai salah satu syarat UAS (Ujian
Akhir Semester). Penulis menyadari bahwa tanpa bimbingan dan dorongan dari
semua pihak, maka penulisan makalah ini tidak akan lancar.
Penulis menyadari bahwa penulisan makalah ini masih jauh sekali dari
sempurna, untuk itu penulis mohon kritik dan saran yang bersifat membangun
demi kesempurnaan penulisan dimasa yang akan datang.
Akhir kata penulis berharap semoga makalah ini bermanfaat bagi penulis dan
khususnya semua pembaca yang berminat.
Bogor, Desember 2018
Penulis
ii
DAFTAR ISI
Halaman
Lembar Judul Makalah ................................................................................. i

Kata Pengantar .............................................................................................. ii
Daftar Isi...................................................................................................... iii
BAB I LATAR BELAKANG ............................................................. 1

1.1. Latar Belakanng Permasalahan .............................................. 1
1.2. Identifikasi Masalah ............................................................... 2
1.3. Hipotesis ................................................................................. 2
BAB II LANDASAN TEORI ............................................................. 5

2.1. Tinjauan Pustaka .............................................................. 5
2.1.1. Data Mining ................................................................. 5
2.1.2. Algoritma C45 .............................................................. 6
2.2. Penelitian Terkait ............................................................... 9
BAB III METODELOGI PENELITIAN ............................................ 12

3.1. Tahapan Penelitian ............................................................. 12
3.2. Metode Analisis Data ........................................................... 13
BAB IV HASIL DAN PEMBAHASAN ................................................. 16
BAB V PENUTUP ................................................................................... 30

5.1. Kesimpulan ........................................................................... 30
5.2. Saran ...................................................................................... 30
DAFTAR PUSTAKA ................................................................................... 32
iii
BAB I
PENDAHULUAN
1.1. Latar Belakang Masalah
Penyimpanan dokumen secara digital berkembang dengan pesat seiring
meningkatnya penggunaan computer. Kondisi tersebut memunculkan masalah
untuk mengakses informasi yang diinginkan secara akurat dan cepat. Oleh karena
itu, walaupun sebagian besar dokumen digital tersimpan dalam bentuk teks dan
berbagai algoritma yang efisien untuk pencarian teks telah dikembangkan, teknik
pencarian terhadap seluruh isi dokumen yang tersimpan bukanlah solusi yang
tepat mengingat pertumbuhan ukuran data yang tersimpan pada umumnya.
Teknologi pengumpulan dan penyimpanan data telah memudahkan
organisasi untuk mengumpulkan sejumlah data berukuran besar sehingga
menghasilkan gunung data. Data mining adalah teknologi yang merupakan
campuran metode-metode analisis data dengan algoritma-algoritma untuk
memproses data berukuran besar. Data mining telah banyak diaplikasikan dalam
berbagai bidang, diantanya dalam bidang bisnis dan kedokteran. Dalam bidang
bisnis, sangat perlu dilakukan terutama dalam mengelola Data yang sangat besar
untuk memudahkan aktifitas recording suatu transaksi dan untuk proses data
warehousing agar dapat memberikan informasi yang akurat bagi penggunanya.
Perkembangan teknologi setiap tahunnya semakin pesat, segala bidang tak
bisa lepas dari komputer dan teknologinya. Teknolgi computer menjangkau segala
bidang aktivitas kehidupan manusia, mulai dari kesehatan, bisnis, pendidikan,
organisasi dan masyarakat. Dalam bidang kesehatan penggunaan teknologi juga
1
2
sangat dibutuhkan untuk mendapatkan informasi-informasi penting terkait
kesehatan seseorang. Salah satu kasus dibidang kesehatan yaitu bagaimana
mengetahui kesesuaian lensa kontak dengan mata pasien berdasarkan informasi-
informasi yang ada.
Kesesuaian lensa kontak terhadap mata seseorang sangatlah penting selain
membuat si pengguna lensa kontak nyaman juga menghindari resiko-resiko yang
dapat timpul dari kontak lensa itu sendiri, seperti lecet pada mata, infeksi mata,
serta beberapa permasalahan yang terjadi akibat kontak lensa. Namun lensa
kontak merupakan salah satu alat medis yang paling aman jika digunakan dengan
bertanggung jawab dan sesuai dengan kebutuhan mata pasien.
1.2. Identifikasi Masalah
1. Apakah kesalahan pemeriksaan mata untuk kontak lensa sangat berpengaruh
pada kesehatan untuk pasien atau bias berbahaya?
2. Mengapa kesesuaian lensa kontak begitu penting dal. am pemeriksaan mata
untuk pasien?
1.3. Hipotesis
1. Usia Pasien (Age of the Patient)
Peniliti ingin mengetahui apakah Usia Pasien (Age of the Patient)
mempengaruhi pada kesehatan mata pasien. Maka peneliti membuat rumusan
masalah sebagai berikut :
Apakah usia pasien (Age of the Patient) mempengaruhi kesehatan mata
pasien?
3
Dari rumusan masalah di atas, peneliti memiliki dua pilihan hipotesis yang
sesuai dengan dasar teori yang digunakan, yaitu :
H0 : Usia Pasien (Age of the Patient) mempengaruhi kesehatan mata pasien.
H1 : Usia Pasien (Age of the Patient) tidak mempengaruhi kesehatan mata
pasien.
2. Jenis kacamata (Spectacle Presception)
Peniliti ingin mengetahui apakah Jenis Kacamata (Spectacle Presception)
mempengaruhi lensa kontak pada pasien. Maka peniliti membuat rumusan
masalah sebagai berikut :
Apakah Jenis Kacamata (Spectacle Presception) mempengaruhi lensa
kontak pada pasien?
H0 : Jenis Kacamata (Spectacle Presception) mempengaruhi lensa kontak
pada pasien.
H1 : Jenis Kacamata (Spectacle Presception) tidak mempengaruhi lensa
kontak pada pasien.
3. Mata Silinder (Asigmatic)
Peniliti ingin mengetahui apakah kontak lensa berpengaruh bagi penderita
mata silinder (Asigmatic) ?
Maka peniliti membuat rumusan masalah sebagai berikut : Kontak lensa
berpengaruh bagi penderita mata silinder (Asigmatic) ?

4
H0 : kontak lensa berpengaruh bagi penderita mata silinder (Asigmatic).
H1 : kontak lensa tidak berpengaruh bagi penderita mata silinder (Asigmatic).
4. Produksi Air Mata (Tear production)
Peniliti ingin mengetahui apakah Produksi Air Mata (Tear production)
mempengaruhi kesesuaian lensa dalam pemeriksaan mata pada pasien. Maka
peniliti membuat rumusan masalah sebagai berikut :
Apakah Produksi Air Mata (Tear production) mempengaruhi kesesuaian
lensa dalam pemeriksaan mata pada pasien?
H0 :Produksi Air Mata (Tear production) mempengaruhi kesesuaian lensa
dalam pemeriksaan mata pada pasien.
H1 :Produksi Air Mata (Tear production) tidak mempengaruhi kesesuaian
lensa dalam pemeriksaan mata pada pasien.

BAB II
LANDASAN TEORI
2.1. Tinjauan Pustaka
2.2.1. Data Mining
Menurut Han dan Kamber (2011) data mining adalah proses menemukan
pola yang menarik dan pengetahuan dari data yang berjumlah besar. Sedangkan
menurut Linoff dan Berry (2011) Data mining adalah suatu pencarian dan analisa
dari jumlah data yang sangat besar dan bertujuan untuk mencari arti dari pola dan
aturan. Lalu menurut Connolly dan Begg (2010) Data mining adalah suatu proses
ekstraksi atau penggalian data yang belum diketahui sebelumnya, namun dapat
dipahami dan berguna dari database yang besar serta digunakan untuk membuat
suatu keputusan bisnis yang sangat penting.
Sedangkan menurut Vercellis (2009) Data mining adalah aktivitas yang
menggambarkan sebuah proses analisis yang terjadi secara iteratif pada database
yang besar, dengan tujuan mengekstrak informasi dan knowledge yang akurat dan
berpotensial berguna untuk knowledge workers yang berhubungan dengan
pengambilan keputusan dan pemecahan masalah. Dari beberapa teori yang
dijabarkan oleh para ahli diatas, bahwa Data mining adalah suatu pencarian dan
analisa pada suatu koleksi data (database) yang sangat besar sehingga ditemukan
suatu pola yang menarik dengan tujuan mengekstrak informasi dan knowledge
yang akurat dan berpotensial, serta dapat dipahami dan berguna dari database
yang besar serta digunakan untuk membuat suatu keputusan bisnis yang sangat
penting.
5
6
Definisi umum dari data mining itu sendiri adalah proses pencarian pola-
pola yang tersembunyi (hidden patern) berupa pengetahuan (knowledge) yang
tidak diketahui sebelumnya dari suatu sekumpulan data yang mana data tersebut
dapat berada di dalam database, data werehouse, atau media penyimpanan
informasi yang lain. Hal penting yang terkait di dalam data mining adalah:
1. Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2. Data yang akan diproses berupa data yang sangat besar.
3. Tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin
memberikan indikasi yang bermanfaat. (Kusrini dan Emha Taufiq, 2009)
2.2.2. Algoritma C45
A. Pengertian Algoritma C45
Algoritma C4.5 merupakan kelompok algoritma Decision Tree. Algoritma
ini mempunyai input berupa training samples dan samples. Training
samples berupa data contoh yang akan digunakan untuk membangun
sebuah tree yang telah diuji kebenarannya. Sedangkan samples merupakan field-
field data yang nantinya akan digunakan sebagai parameter dalam melakukan
klasifikasi data (Sunjana, 2010).
B. Klasifikasi
Klasifikasi data merupakan suatu proses yang menemukan properti-properti yang
sama pada sebuah himpunan obyek di dalam sebuah basis data dan
mengklasifikasikannya ke dalam kelas-kelas yang berbeda menurut model
klasifikasi yang ditetapkan. Tujuan dari klasifikasi adalah untuk menemukan
model dari training set yang membedakan atribut ke dalam kategori atau kelas
7
yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan
atribut yang kelasnya belum diketahui sebelumnya. Teknik klasifikasi terbagi
menjadi beberapa teknik yang diantaranya adalah Pohon Keputusan.
Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat
kuat dan terkenal. Metode pohon keputusan mengubah fakta yang sangat besar
menjadi pohon keputusan yang merepresentasikan aturan. Aturan dapat dengan
mudah dipahami dengan bahasa alami. Dan mereka juga dapat diekspresikan
dalam bentuk bahasa basis data seperti Structured Query Language untuk
mencari record pada kategori tertentu. Pohon keputusan juga berguna untuk
mengeksplorasi data, menemukan hubungan tersembuyi antara sejumlah calon
variabel input dengan sebuah variabel target. Karena pohon keputusan
memadukan antara eksplorasi data dan pemodelan, dan sangat bagus sebagai
langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model
akhir dari beberapa teknik lain (Kusrini, 2009).
C. Prinsip Kerja Algoritma C45
Pada tahap pembelajaran algoritma C4.5 memiliki 2 prinsip kerja yaitu:
1. Pembuatan pohon keputusan. Tujuan dari algoritma penginduksi pohon
keputusan adalah mengkontruksi struktur data pohon yang dapat digunakan
untuk memprediksi kelas dari sebuah kasus atau record baru yang belum
memiliki kelas. C4.5 melakukan konstruksi pohon keputusan dengan
metode divide and conquer. Pada awalnya hanya dibuat node akar dengan
menerapkan algoritma divide and conquer. Algoritma ini memilih
pemecahan kasus-kasus yang terbaik dengan menghitung dan

8
membandingkangain ratio, kemudian node-node yang terbentuk di level
berikutnya, algoritma divide and conquer akan diterapkan lagi sampai
terbentuk daun-daun.
2. Pembuatan aturan-aturan (rule set). Aturan-aturan yang terbentuk dari pohon
keputusan akan membentuk suatu kondisi dalam bentuk if-then. Aturan-
aturan ini didapat dengan cara menelusuri pohon keputusan dari akar sampai
daun. Setiap node dan syarat percabangan akan membentuk suatu kondisi
atau suatu if, sedangkan untuk nilai-nilai yang terdapat pada daun akan
membentuk suatu hasil atau suatu then.
Information Gain
Information gain adalah salah satu attribute selection measure yang
digunakan untuk memilih test attribute tiap node pada tree. Atribut dengan
informasi gain tertinggi dipilih sebagai test atribut dari suatu node (Sunjana,
2010). Dalam prosesnya perhitungan gain bisa terjadi atau tidak suatu missing
value.
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti tertera
dalam persamaan 1 berikut :
Gain(S,A) = Entropy(S)−∑ |𝑆𝑖| |𝑆| 𝑛𝑖=1 ∗𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖) …(1)
Keterangan:
S : himpunan kasus |Si| : jumlah kasus pada partisi ke-i
A : atribut |S| : jumlah kasus dalam S
n : jumlah partisi atribut A

9
Sementara itu, penghitungan nilai entropi dapat dilihat pada persamaan 2
berikut :
Keterangan:
S : himpunan kasus n : jumlah partisi S
I : fitur pi : proporsi dari S_i terhadap S
2.2. Penelitian Terkait
Dalam penyusunan makalah ini, penulis sedikit banyak terinspirasi dan
mereferensi dari penelitian-penelitian sebelumnya yang berkaitan dengan latar
belakang masalah pada makalah ini. Adapun penelitian yang berhubungan dengan
makalah ini antara lain yaitu :
Penelitian yang dilakukan oleh Ratna Idayati,Firdalena Mutia 2016 yang
berjudul “Gambaran Penggunaan Lensa (Soft Lens) Pada Mahasiswa Universitas
Syiah Kuala Ditinjau Dari Jenis Lensa, Pola Pemakaian, Jangka Waktu Dan Iritasi
Yang Ditimbulkan”. Penelitian ini bertujuan untuk mengetahui gambaran
penggunaan lensa kontak pada mahasiswa Universitas Syiah Kuala ditinjau dari
jenis lensa pada pemakaian, waktu dan iritasi yang ditimbulkan. Sebuah data
deskriptif cross sectional telah dilakukan terhadap mahasiswa Universitas Syiah
Kuala, Banda Aceh.Sebanyak 193 mahasiswa yang menggunakan lensa kontak
telah diwawancarai dan mengisi kuisioner. Mahasiswa Unsyiah paling banyak
menggunakan lensa jenis soft lense (99,48%) dengan pola pemakaian harian
(97,93%). Jangka waktu pemakaian terbesar pada kategori 1-6 bulan (53,4%)
10
dengan lama waktu telah menggunakan lensa kontak terbanyak yaitu 6 bulan – 1
tahun. Penggunaan cairan tetes mata lebih dari 1 x perhari. Kebersihan responden
dalam menggunakan lensa kontak cukup bersih (49,74%). Kejadian mata merah
pada responden akibat penggunaan lensa kontak mencapai 65% dan lama keluhan
akan hilang kurang dari 1 hari (63,73%). Kejadian mata merah yang disertai
adanya keluhan mata lain sekitar 57% dan 83,42% responden yang mengalami
iritasi mata tidak pernah berkonsultasi ke dokter.( JKS 20016;3;129- 134)
Penelitian yang dilakukan oleh Widya Halimatus syaqdiyah,Riski
Prihatmingtias, Arnila Novitasari Saubig pada tahun 2017 yang berjudul
“Hubungan Lama Pemakaian Lensa Kontak Dengan Mata Kering. ” hasil
penelitian yang dilakukan menyatakan bahwa Pengambilan data penelitian
dilakukan pada bulan Mei-September 2017. Penelitian ini melibatkan 50 mata dari
26 orang mahasiswi Universitas Diponegoro Semarang. Seluruh subjek berjenis
kelamin perempuan dengan usia antara 18-22 tahun. Karakteristik subjek
penelitian ditampilkan dalam tabel berikut :
Tabel I
Distribusi Data lama Pemakaian Kontak Lensa
Lama Frekuensi % Mean ± (SD) Median (min-mak)

Pemakaian
1 bulan 2 4
2 bulan 6 12
3 bulan 4 8
6 bulan 8 16
9 bulan 2 4 26,7 ± (24,61) 12,5 (1-60)
11 bulan 3 6
14 bulan 2 4
24 bulan 2 4
36 bulan 2 4
42 bulan 3 6
48 bulan 2 4
60 bulan 14 28
11
Berdasar tabel 1 diketahui bahwa lama pemakaian lensa kontak berkisar
antara 1 hingga 60 bulan. Lama pemakaian lensa kontak dengan jumlah terbanyak
adalah 60 bulan (5 tahun).
Hasil Pengukuran Tes Schirmer Dari hasil pengukuran tes Schirmer
didapatkan hasil sebagai berikut :
Tabel II
Hasil Pengukuran Test Schimer
Mean ± (SD) Median (min-mak)

Hasil Pengukuran Test 21,36 ± (11,81) 20,5 ( 2–35)
Schirmer
Berdasar tabel 2 diketahui bahwa rerata hasil pengukuran tes Schirmer
adalah 21,36 + (11,81) mm. Hasil pengukuran tes Schirmer dapat digambarkan
pada grafik dibawah ini:
Berdasarkan gambar 1, dari 50 mata yang telah dilakukan pengukuran tes
Schirmer, didapatkan 12 mata kering dan 38 mata dengan produksi air mata
normal.
BAB III
METODOLOGI PENELITIAN
Metodologi yang digunakan oleh penulis dalam menentukan penggunaan
kontak lensa pas menggunakan tahapan Algoritma C.45, Proses klasifikasi
penggunaan kontak lensa pass menggunakan lima langkah dalam KDD
(Knowledge Discovery in Databases), yang mencakup beberapa aktivitas yaitu
seleksi, praproses, transformasi, data mining, interprestasi dan evaluasi. Data
tersebut merupakan Data sekunder adalah data yang diperoleh secara tidak
langsung bersumber dari dokumentasi, literatur, buku, jurnal dan informasi
lainnya yang ada hubungannya dengan masalah yang diteliti. Data sekunder pada
penelitian ini adalah buku-buku, jurnal tentang algoritma C4.5 dan data mining.
3.1. Tahapan Penelitian
Metode Penelitian Tahapan yang dilakukan dalam perhitungan penggunaan
kontak lensa pas akan mengacu pada contoh yang baik (Best practice) dengan
menggunakan lima langkah dalam KDD (Knowledge Discovery in Databases).
Lima langkah dalam KDD (Knowledge Discovery in Databases) akan diuraikan
sebagai berikut.
1. Seleksi
Pada tahap awal ini memilih satu set data tentang kriteria penggunaan
kontak lensa pas sebagai acuan yang akan digunakan untuk penelitian.
12
13
2. Praproses
Pada tahap ini kehandalan data ditingkatkan dengan membersihkan data
yang tidak bisa dihitung. Data hasil praproses ini diperoleh sejumlah 20 data.
3. Transformasi
Pada tahap ini disusun dan dikembangkan generasi data yang lebih baik
untuk data mining. Tahap ini juga merupakan proses transformasi pada data
yang akan dipilih sehingga data tersebut sesuai untuk proses data mining.
Proses ini merupakan proses kreatif dan sangat tergantung pada jenis atau pola
informasi yang akan dicari dlaam basis data. Data akan dipakai untuk
penelitian ditransformasikan ke dalam kategori yaitu usia pasien, jenis
kacamata, mata silinder dan produktifitas air mata.
4. Data Mining
Tahap ini memilih jenis algoritma yang akan digunakan dalam klasifikasi
yaitu Algoritma C.45.
5. Evaluasi
Pada tahap ini mengolah data dengan algoritma yang telah dipilih untuk
mendapatkan rule dari hasil klasifikasi dan kemudian dilakukan evaluasi
dengan menerapkan pola yang didapat dari proses sebelumnya terhadap data
testing yang disediakan.
3.2. Metode Analisis Data
Metode yang digunakan peneliti dalam melakukan penelitian adalah metode
klasifikasi. Metode Klasifikasi merupakan proses pembelajaran suatu fungsi

14
tujuan (target) yang memetakan tiap himpunan atribut x ke satu dari label kelas y
yang didefinisikan sebelumnya. Fungsi target disebut juga model klasifikasi.
Ada dua jenis model klasifikasi, yaitu:
1. Pemodelan deskriptif: model klasifikasi yang dapat berfungsi sebagai suatu
alat penjelasan untuk membedakan objek-objek dalam kelaskelas yang
berbeda
2. Pemodelan prediktif: model klasifikasi yang dapat digunakan untuk
memprediksi label kelas record yang tidak diketahui
Metode yang akan digunakan pada penelitian adalah Algoritma C4.5 .
Indentifikasi sampel dari data set baca data. Kemudian menghitung entropy
(S) dari keseluruhan atribut, kemudian menghitung gain tertinggi dari seluruh
atribut, selanjutnya didapatkan atribut yang akan digunakan sebagai akar / node
.buat cabang untuk tiap- tiap nilai, bagi kasus dalam cabang, ulangi perhitungan
Gain sampai semua data telah termasuk dalam kelas yang sama. Atribut yang
telah dipilih tidak lagi diikutkan dalam perhitungan. Dalam kasus data set pada
penelitian ini terdiri dari 2 kelas yaitu debitur dengan kelas Layak yang
dinyatakan (+) dan debitur dengan kelas Tidak Layak yang dinyatakan (-).
A. Cara Pengujian Model / Metode
Dalam perhitungan Algoritma C4.5 data set dibagi menjadi 20 data training
dan 1 data testing. Model Algoritma C4. 5
1. Menghitung jumlah kasus, yang di bagi menkadi 2 kelas yaitu Layak dan
Tidak Layak , dan nilai entropy dari semua atribut yaitu umur pasien, jenis
kacamata, silinder dan produksi air mata. Serta mencari nilai gain dari tiap
atribut.
15
2. Sebelum melakukan perhitungan gain , hitung entropy dari tiap atribut
dengan rumus sebagai berikut
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 = ∑ − 𝑛𝑖=1 𝑝𝑖∗𝑙𝑜𝑔2 𝑝i
Dengan perhitungan yang sama , dilakukan pada atribut berdasarkan
penglompokan jumlah kasus.
3. Kemudian menghitung nilai gain, dan tentukan nilai tertinggi
untukmenentukan node atau akar yang pertama. Berikut rumus perhitungan
gain :
4. Ulangi langkah Ke- 3 hingga semua atribut dan subset terhitung.
5. Proses pembentukan pohon keputusan terhenti jika sudah tidak ada atribut
yang dipartisi dan semua tuple dalam node N telah memiliki kelas yang
sama.
BAB IV
HASIL DAN PEMBAHASAN
1. Judul : Basis Data Untuk Lensa Kontak Pas
2. Sumber :
a. Cendrowska, J. "PRISM: Algoritma untuk menginduksi aturan modular",
International Journal of Man-Machine Studies, 1987, 27, 349-37
b. Donor : Benoit Julien (Julien@ce.cmu.edu)
c. Tanggal : 1 Agustus 1990
3. Jumlah Atribut :4
4. Informasi Atribut :
2 Kelas
Yes : pasien harus dilengkapi dengan lensa kontak yang lembut,
No : pasien tidak boleh dipasangi lensa kontak.
a. Usia pasien (Age of the Patient) :Muda (Young), Prapresbyopic,
Presbyopic
b. Resep tontonan ( Spectacle Prescription) : Myope, Hypermetrope
c. Astigmatik (Asigmatic) : Tidak (No) , Ya (Yes)
d. Tingkat produksi air mata (Tear Production Rate) :Dikurangi (Reduced),
Normal ( Normal)
16
17
Tabel I
Basis Data Kontak Lensa Pas
No Age of the Spectacle Asigmatic Tear Classes

Patient Presception Production
1 Young Myope No Reduced No

2 Young Myope No Normal Yes
3 Young Myope Yes Reduced No
4 Young Hypermetrope No Reduced No
5 Young Hypermetrope No Normal Yes
6 Young Hypermetrope Yes Reduced No
7 Pra-Presbyopic Myope No Reduced No
8 Pra-Presbyopic Myope No Normal Yes
9 Pra-Presbyopic Myope Yes Reduced No
10 Pra-Presbyopic Hypermetrope No Reduced No
11 Pra-Presbyopic Hypermetrope No Normal Yes
12 Pra-Presbyopic Hypermetrope Yes Reduced No
13 Pra-Presbyopic Hypermetrope Yes Normal No
14 Presbyopic Myope No Reduced No
15 Presbyopic Myope No Normal No
16 Presbyopic Myope Yes Reduced No
17 Presbyopic Hypermetrope No Reduced No
18 Presbyopic Hypermetrope No Normal Yes
19 Presbyopic Hypermetrope Yes Reduced No
20 Presbyopic Hypermetrope Yes Normal No
Perhitungan Akar ( Root) Pertama
Jumlah Kasus : 20
Jumlah Kasus Yes :5
Jumlah Kasus No : 15
5 5 15 15
Entropy = (− 20 + 𝑙𝑜𝑔2 (20)) + (− 20 + 𝑙𝑜𝑔2 (20))
= 0.81127812445
18
Perhitungan Entropy Age of the Patient
1. Young
Jumlah Kasus :6
Jumlah Kasus Yes :2
Jumlah Kasus No :4
4 4 2 2
Entropy = (− 6 + 𝑙𝑜𝑔2 (6)) + (− 6 + 𝑙𝑜𝑔2 (6))
= 0.91829583405
2. Pra-Presbyopic
Jumlah Kasus :7
Jumlah Kasus Yes :2
Jumlah Kasus No :5
5 5 2 2
Entropy = (− 7 + 𝑙𝑜𝑔2 (7)) + (− 7 + 𝑙𝑜𝑔2 (7))
= 0.86312056856
3. Presbyopic
Jumlah Kasus :7
Jumlah Kasus Yes :1
Jumlah Kasus No :6
6 6 1 1
Entropy = (− + 𝑙𝑜𝑔2 ( )) + (− + 𝑙𝑜𝑔2 ( ))
7 7 7 7
= 0.59167277858
Perhitungan Gain Age of the Patient
6
Gain = 0.81127812445 − (( ∗ 0.918295834005)
20
7 7
+ ( ∗ 0.86312056856) + ( ∗ 0.59167277858))
20 20
Gain = 0.02661170273
19
Perhitungan Entropy Spectacle Presception
1. Myope
Jumlah Kasus :9
Jumlah Kasus Yes :2
Jumlah Kasus No :7
7 7 2 2
Entropy = (− 9 + 𝑙𝑜𝑔2 (9)) + (− 9 + 𝑙𝑜𝑔2 (9))
= 0.7642045065
2. Hypermetrope
Jumlah Kasus : 11
Jumlah Kasus Yes :3
Jumlah Kasus No :8
8 8 3 3
Entropy = (− 11 + 𝑙𝑜𝑔2 (11)) + (− 11 + 𝑙𝑜𝑔2 (11))
= 0.84535093662
Perhitungan Gain Spectacle Preception
9 11
Gain = 0.81127812445 − (( ∗ 0.7642045065) + ( ∗ 0.84535093662)
20 20
Gain = 0.02661170273
Perhitungan Entropy Asigmatic
1. Yes
Jumlah Kasus :8
Jumlah Kasus Yes :0
Jumlah Kasus No :8
20
8 8 0 0
Entropy = (− 8 + 𝑙𝑜𝑔2 (8)) + (− 8 + 𝑙𝑜𝑔2 (8))
=0
2. No
Jumlah Kasus : 12
Jumlah Kasus Yes :5
Jumlah Kasus No :7
7 7 5 5
Entropy = (− 12 + 𝑙𝑜𝑔2 (12)) + (− 12 + 𝑙𝑜𝑔2 (12))
= 0.97986875665
Perhitungan Gain Asigmatic
8 12
Gain = 0.81127812445 − (( ∗ 0) + ( ∗ 0.97986875665)
20 20
Gain = 0.22335687046
Perhitungan Entropy Tear Production
1. Reduced
Jumlah Kasus : 12
Jumlah Kasus Yes :0
Jumlah Kasus No : 12
12 12 0 0
Entropy = (− 12 + 𝑙𝑜𝑔2 (12)) + (− 12 + 𝑙𝑜𝑔2 (12))
=0
2. Normal
Jumlah Kasus :8
Jumlah Kasus Yes :5
Jumlah Kasus No :3
21
3 3 5 5
Entropy = (− 8 + 𝑙𝑜𝑔2 (8)) + (− 8 + 𝑙𝑜𝑔2 (8))
= 0.95443400292
Perhitungan Gain Tear Production Rate
12 8
Gain = 0.81127812445 − (( ∗ 0) + ( ∗ 0.95443400292)
20 20
Gain = 0.42950542328
Atribut Kasus Yes No Entropy Gain

Total 20 5 15 0.81127812445
Age 0.02661170273
Young 6 4 2 0.91829583405
Pra-Pres 7 2 5 0.86312056856
Presbyopic 7 1 6 0.59167277858
Spectacle 0.02661170273
Myope 9 2 7 0.7642045065
Hypermetrope 11 3 8 0.84535093662
Astigmatic 0.22335687046
Yes 8 0 8 0
No 12 5 7 0.97986875665
Tear 0.42950542328
Reduced 12 0 12 0
Normal 8 5 3 0.95443400292
1
Tear
Production
Reduced Normal
No
1.1
???
22
Tabel II
Tear Prediction Rate (Normal)

1 Young Myope No Normal No

2 Young Hypermetrope No Normal Yes
3 Pra-Presbyopic Myope No Normal No
4 Pra-Presbyopic Hypermetrope No Normal No
5 Pra-Presbyopic Hypermetrope Yes Normal Yes
7 Presbyopic Hypermetrope No Normal No
8 Presbyopic Hypermetrope Yes Normal Yes
Perhitungan Akar Tear Production Rate (Normal)
Jumlah Kasus :8
Jumlah Kasus Yes :5
Jumlah Kasus No :3
3 3 5 5
Entropy = (− 8 + 𝑙𝑜𝑔2 (8)) + (− 8 + 𝑙𝑜𝑔2 (8))
= 0.95443400292
1. Young
Jumlah Kasus :2
Jumlah Kasus Yes :2
Jumlah Kasus No :0
0 0 2 2
Entropy = (− 2 + 𝑙𝑜𝑔2 (2)) + (− 2 + 𝑙𝑜𝑔2 (2))
=0
23
2. Pra-Presbyopic
Jumlah Kasus :3
Jumlah Kasus Yes :2
Jumlah Kasus No :1
1 1 2 2
Entropy = (− 3 + 𝑙𝑜𝑔2 (3)) + (− 3 + 𝑙𝑜𝑔2 (3))
= 0.91829583405
3. Presbyopic
Jumlah Kasus :3
Jumlah Kasus Yes :1
Jumlah Kasus No :2
2 2 1 1
Entropy = (− 3 + 𝑙𝑜𝑔2 (3)) + (− 3 + 𝑙𝑜𝑔2 (3))
= 0.91829583405
2 3
Gain = 0.95443400292 − (( ∗ 0) + ( ∗ 0.91829583405)
8 8
3
+ ( ∗ 0.91829583405) )
8
Gain = 0.26571212738
1. Myope
Jumlah Kasus :3
Jumlah Kasus Yes :2
Jumlah Kasus No :1
1 1 2 2
Entropy = (− 3 + 𝑙𝑜𝑔2 (3)) + (− 3 + 𝑙𝑜𝑔2 (3))
= 0.91829583405
24
2. Hypermetrope
Jumlah Kasus :5
Jumlah Kasus Yes :3
Jumlah Kasus No :2
2 2 3 3
Entropy = (− 5 + 𝑙𝑜𝑔2 (5)) + (− 5 + 𝑙𝑜𝑔2 (5))
= 0.970959445
Perhitungan Gain Spectacle Preseption
3 5
Gain = 0.95443400292 − (( ∗ 0.91829583405) + ( ∗ 0.970959445) )
8 8
Gain = 0.003322894362
Perhitungan Entropy Asigmatic
1. No
Jumlah Kasus :6
Jumlah Kasus Yes :5
Jumlah Kasus No :1
1 1 5 5
Entropy = (− 6 + 𝑙𝑜𝑔2 (6)) + (− 6 + 𝑙𝑜𝑔2 (6))
= 0.65002242164
2. Yes
Jumlah Kasus :2
Jumlah Kasus Yes :0
Jumlah Kasus No :2
2 2 0 0
Entropy = (− 2 + 𝑙𝑜𝑔2 (2)) + (− 2 + 𝑙𝑜𝑔2 (2))
=0
25
Perhitungan Gain Spectacle Preseption
6 2
Gain = 0.95443400292 − (( ∗ 0.65002242164) + ( ∗ 0) )
8 8
Gain = 0.46691718669

Total 8 5 3 0.95443400292
Age 0.26571212738
Young 2 2 0 0
Pra-Pres 3 2 1 0.91829583405
Presbyopic 3 1 2 0.91829583405
Spectacle 0.003322894362
Myope 3 2 1 0.91829583405
Hypermetrope 5 3 2 0.970959445
Astigmatic 0.46691718669
No 6 5 1 0.65002242164
Yes 2 0 2 0
1
Tear
Production
Reduced Normal
No 1.1
Asigmatic
Yes No
No 1.1.2
???
26
Tabel III
Tear Prediction Rate (Normal) – Asigmatic (No)

1 Young Myope No Normal No

2 Young Hypermetrope No Normal No
3 Pra-Presbyopic Myope No Normal No
4 Pra-Presbyopic Hypermetrope No Normal No
Perhitungan Akar Tear Production Rate (Normal) – Asigmatic (No)
Jumlah Kasus :6
Jumlah Kasus Yes :5
Jumlah Kasus No :1
1 1 5 5
Entropy = (− 6 + 𝑙𝑜𝑔2 (6)) + (− 6 + 𝑙𝑜𝑔2 (6))
= 0.65002242164
1. Young
Jumlah Kasus :2
Jumlah Kasus Yes :0
Jumlah Kasus No :2
2 2 0 0
Entropy = (− 2 + 𝑙𝑜𝑔2 (2)) + (− 2 + 𝑙𝑜𝑔2 (2))
=0
27
2. Pra-Presbyopic
Jumlah Kasus :2
Jumlah Kasus Yes :0
Jumlah Kasus No :2
2 2 0 0
Entropy = (− 2 + 𝑙𝑜𝑔2 (2)) + (− 2 + 𝑙𝑜𝑔2 (2))
=0
3. Presbyopic
Jumlah Kasus :2
Jumlah Kasus Yes :1
Jumlah Kasus No :1
1 1 1 1
Entropy = (− 2 + 𝑙𝑜𝑔2 (2)) + (− 2 + 𝑙𝑜𝑔2 (2))
=1
2 2 2
Gain = 0.65002242164 − (( ∗ 0) + ( ∗ 0) + ( ∗ 1) )
6 6 6
Gain = 0.3166890883
1. Myope
Jumlah Kasus :3
Jumlah Kasus Yes :0
Jumlah Kasus No :3
3 3 0 0
Entropy = (− 3 + 𝑙𝑜𝑔2 (3)) + (− 3 + 𝑙𝑜𝑔2 (3))
=0
28
2. Hypermetrope
Jumlah Kasus :3
Jumlah Kasus Yes :1
Jumlah Kasus No :2
2 2 1 1
Entropy = (− 3 + 𝑙𝑜𝑔2 (3)) + (− 3 + 𝑙𝑜𝑔2 (3))
= 0.91829583405
Perhitungan Gain Spectacle Presception
3 3
Gain = 0.65002242164 − (( ∗ 0) + ( ∗ 0.91829583405) )
6 6
Gain = 0.19087450461

Total 8 5 3 0.65002242164
Age 0.3166890883
Young 2 0 2 0
Pra-Pres 2 0 2 0
Presbyopic 2 1 1 1
Spectacle 0.19087450461
Myope 3 0 3 0
Hypermetrope 3 1 2 0.91829583405
Tabel IV
Tear Prediction Rate (Normal) – Asigmatic (No) – Age (Presbyopic)


29
1
Tear
Production
Reduced Normal
No 1.1
Asigmatic
No Yes
1.1.2 No
Age of the
Patient
Young Presbyopic
Pra-Presbyopic
No No 1.1.2.3
Spectacle
Prescription
Hypermetrope Myope
Yes No
Berdasarkan pohon keputusan diatas, dapat dibentuk rule classification sebagai
berikut :
1. R1 : IF Tear Production = Normal AND Asigmatic = Yes THEN tidak perlu
menggunakan kontak lensa
2. R2 : IF Tear Production = Normal AND Asigmatic = No AND Age of the
Patient = Young THEN tidak perlu menggunakan kontak lensa
3. R3 : IF Tear Production = Normal AND Asigmatic = No AND Age of the
Patient = Pra-presbyopic THEN tidak perlu menggunakan kontak lensa
4. R4 : IF Tear Production = Normal AND Asigmatic = No AND Spectacle
Prescription = Hypermetrope THEN perlu menggunakan kontak lensa
5. R5 : IF Tear Production = Normal AND Asigmatic = No AND Spectacle
Prescription = Myope THEN tidak perlu menggunakan kontak lensa
6.
7.
BAB V
PENUTUP
4.1. Kesimpulan
Setelah dilakukan uji coba dalam penelitian dan perhitungan dengan
menggunakan algoritma C4.5 dapat disimpulkan beberapa hal sebagai berikut :
1. Algoritma C4.5 menggunakan perhitungan entropy, information gain dan
gain ratio untuk membentuk sebuah pola berupa pohon keputusan.
2. Dari hasil penelitian yang dilakukan dapat disimpulkan bahwa algoritma
C4.5 dapat digunakan sebagai alat analisa yang dilakukan oleh bidang
kedokteran atau kesehatan terutama kontak lensa pada mata. Hal ini
diperkuat dengan hasil evaluasi penelitian bahwa algoritma C4.5 mampu
menganalisa bahwa kesesuaian kontak lensa mata pada pasien sangatlah
penting untuk kesehatan pengguna sendiri jika terjadi kesalahanpun akan
berakibat buruk pada pasien tersebut.
3. Dari pembahasan tersebut maka hal yang paling mempengaruhi untuk
pemilihan lensa kontak yaitu jenis kacamata yang digunakan kemudian
dilanjutkan dengan usia pasien, silinder dan produksi air mata.
4.2. Saran
Berdasarkan proses pengujian dan kesimpulan yang telah dilakukan, maka
ada beberapa saran dalam penelitian ini adalah:
30
31
1. Menambahkan jumlah data yang lebih besar dan atribut yang lebih banyak,
sehingga hasil pengukuran yang akan didapatkan lebih baik lagi.
2. Meningkatkan lagi sistem analisa pemeriksaan kontak lensa pas pada mata
untuk penentuan hasil pemeriksaan kesehatan pada pasien.
3. Penerapan kedalam sebuah aplikasi berbasis teknologi informasi guna
membantu pihak bidang kedokteran atau kesehatan untuk pemeriksaan
kontak lensa pada mata seseorang.

DAFTAR PUSTAKA
Berry, J. Michael dan Linoff, Gordon. 2011. Data Mining Techniques : For
Marketing, Sales, and Costumer Support. New York : John Wiley and
Sons, inc
Connolly, T., Begg, C. 2010. Database Systems: a practical approach to design,

implementation, and management. 5th Edition. Amerika: Pearson
Education
Han, J dan Kamber, M. 2011. Data Mining : Concepts and Techniques.

Burlington : Morgan Kaufmann
Julian, Benoit. 1990.Basis Data Untuk Lensa Kontak Pas. Diambil dari :
http://www.ics.uci.edu/~mlearn/MLRepository.html
(08 Desember 2018)
Kusrini dan Taufiq, Emha. 2009. Algoritma Data Mining, Yogyakarta : Andi
Offical
Syaqdiyah, W. Halimatus. Prihatiningtias, Riski dan Saubig , A. Novitasari.

2018.Hubungan Lama Pemakaian Lensa Kontak Dengan Mata Kering.
Semarang. Jurnal Kedokteran Dipenegoro. Vol.7 No.2.
Indayati, Ratna dan Mutia , Firdalena. 2016 . Gambaran Penggunaan Lensa

Kontak ( Soft Lens) Pada Mahasiswa Universitas Syiah Kuala Ditinjau
Dari Jenis lensa, Pola Pemakaian, Jangka Waktu dan Iritasi Yang
Ditimbulkan. Banda Aceh. Jurnal Kedokteran Syiah Kuala. Vol.16 No.3.
32

Data Mining PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Data Mining PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

PENGOLAHAN BASIS DATA UNTUK PEMILIHAN

KONTAK LENSA PAS MENGGUNAKAN METODE

Denti Yusniar 11152380

Program Studi Sistem Informasi

melimpahkan rahmat dan karunia-Nya, sehingga pada akhirnya penulis dapat

Menggunakan Metode Klasifikasi dan Algoritma C45”.

semua pihak, maka penulisan makalah ini tidak akan lancar.

demi kesempurnaan penulisan dimasa yang akan datang.

khususnya semua pembaca yang berminat.

Bogor, Desember 2018

Lembar Judul Makalah ................................................................................. i

BAB I LATAR BELAKANG ............................................................. 1

BAB II LANDASAN TEORI ............................................................. 5

BAB III METODELOGI PENELITIAN ............................................ 12

BAB IV HASIL DAN PEMBAHASAN ................................................. 16

BAB V PENUTUP ................................................................................... 30

DAFTAR PUSTAKA ................................................................................... 32

1.1. Latar Belakang Masalah

Penyimpanan dokumen secara digital berkembang dengan pesat seiring

meningkatnya penggunaan computer. Kondisi tersebut memunculkan masalah

tepat mengingat pertumbuhan ukuran data yang tersimpan pada umumnya.

Teknologi pengumpulan dan penyimpanan data telah memudahkan

organisasi untuk mengumpulkan sejumlah data berukuran besar sehingga

menghasilkan gunung data. Data mining adalah teknologi yang merupakan

campuran metode-metode analisis data dengan algoritma-algoritma untuk

warehousing agar dapat memberikan informasi yang akurat bagi penggunanya.

Perkembangan teknologi setiap tahunnya semakin pesat, segala bidang tak

bidang aktivitas kehidupan manusia, mulai dari kesehatan, bisnis, pendidikan,

organisasi dan masyarakat. Dalam bidang kesehatan penggunaan teknologi juga

sangat dibutuhkan untuk mendapatkan informasi-informasi penting terkait

kesehatan seseorang. Salah satu kasus dibidang kesehatan yaitu bagaimana

mengetahui kesesuaian lensa kontak dengan mata pasien berdasarkan informasi-

informasi yang ada.

Kesesuaian lensa kontak terhadap mata seseorang sangatlah penting selain

membuat si pengguna lensa kontak nyaman juga menghindari resiko-resiko yang

bertanggung jawab dan sesuai dengan kebutuhan mata pasien.

1.2. Identifikasi Masalah

1. Apakah kesalahan pemeriksaan mata untuk kontak lensa sangat berpengaruh

pada kesehatan untuk pasien atau bias berbahaya?

2. Mengapa kesesuaian lensa kontak begitu penting dal. am pemeriksaan mata

1. Usia Pasien (Age of the Patient)

Peniliti ingin mengetahui apakah Usia Pasien (Age of the Patient)

mempengaruhi pada kesehatan mata pasien. Maka peneliti membuat rumusan

masalah sebagai berikut :

Apakah usia pasien (Age of the Patient) mempengaruhi kesehatan mata

sesuai dengan dasar teori yang digunakan, yaitu :

H0 : Usia Pasien (Age of the Patient) mempengaruhi kesehatan mata pasien.

H1 : Usia Pasien (Age of the Patient) tidak mempengaruhi kesehatan mata

2. Jenis kacamata (Spectacle Presception)

Peniliti ingin mengetahui apakah Jenis Kacamata (Spectacle Presception)

mempengaruhi lensa kontak pada pasien. Maka peniliti membuat rumusan

masalah sebagai berikut :

Apakah Jenis Kacamata (Spectacle Presception) mempengaruhi lensa

kontak pada pasien?

sesuai dengan dasar teori yang digunakan, yaitu :

H0 : Jenis Kacamata (Spectacle Presception) mempengaruhi lensa kontak

H1 : Jenis Kacamata (Spectacle Presception) tidak mempengaruhi lensa

kontak pada pasien.

3. Mata Silinder (Asigmatic)

Peniliti ingin mengetahui apakah kontak lensa berpengaruh bagi penderita

mata silinder (Asigmatic) ?

Maka peniliti membuat rumusan masalah sebagai berikut : Kontak lensa

berpengaruh bagi penderita mata silinder (Asigmatic) ?