TINJAUAN PUSTAKA
6
7
suatu komputer, instruksi atau pernyataan yang disusun sedemikian rupa sehingga
Aplikasi akan menggunakan sistem operasi (OS) komputer dan aplikasi yang
lainnya yang mendukung. Istilah ini mulai perlahan masuk ke dalam istilah
Teknologi Informasi semenjak tahun 1993, yang biasanya juga disingkat dengan
App. Secara historis, aplikasi adalah software yang dikembangkan oleh sebuah
Data mining merupakan salah satu proses inti yang terdapat dalam KDD.
Banyak orang memperlakukan data mining sebagai sinonim dari KDD, karena
sebagian besar pekerjaan dalam KDD difokuskan pada data mining. Namun,
kesuksesan dari aplikasi KDD. Data mining adalah kegiatan yang meliputi
hubungan dalam set data berukuran besar . Maksud dari pengertian ini yaitu
8
proses pencarian informasi yang tidak diketahui sebelumnya dari sekumpulan data
2. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang
2.2.2.2 Klasifikasi
yang sama pada sebuah himpunan obyek di dalam sebuah basis data dan
model dari training set yang membedakan atribut ke dalam kategori atau kelas
teknik pohon keputusan yang terkenal dan disukai karena memiliki kelebihan-
kelebihan. Kelebihan ini misalnya dapat mengolah data numerik (kontinyu) dan
kelas terhadap data baru atau yang belum diketahui sebelumnya dengan baik.
Dalam hal kecepatan atau efisiensi waktu komputasi yang diperlukan untuk
dengan benar walaupun data ada nilai dari atribut yang hilang. Dan juga
skalabilitas yaitu kemampuan untuk membangun model secara efisien untuk data
dari akar sampai daun. Setiap node dan syarat percabangan akan
yang terdapat pada daun akan membentuk suatu hasil atau suatu then.
mata kuliah yaitu : Algoritma Pemrograman 1, Fisika 1 dan Fisika 2. Dengan nilai
atribut awal dalam implementasi Algoritma C4.5 dan atribut tujuannya adalah
masa studi dengan nilai dari atribut masa studi adalah “kurang” dan “lebih”.
Kurang artinya lulus kurang dari lima tahun dan lebih artinya lulus lebih dari lima
tahun.
a 3 2 1 0.9183
b 3 1 2 0.9183
c 3 2 1 0.9183
d 3 0 3 0
e 3 0 3 0
fisika1 a 3 2 1 0.9183 0.7264 0.1919
b 3 1 1 1
c 3 1 6 0.59167
d 3 1 1 1
e 3 0 1 0
fisika2 a 3 2 1 0.9183 0.4 0.5183
b 4 3 1 0.81128
c 3 0 3 0
d 4 0 4 0
e 1 0 1 0
Dari tabel di atas terdapat gain untuk masing-masing mata kuliah. Dimana hasil
ketentuan dalam algoritma C4.5, setiap atribut yang memiliki gain tertinggi akan
menjadi root atau node. Dari ketiga mata kuliah tersebut, matakuliah yang
memiliki gain tertinggi adalah Fisika 2, maka mata kuliah Fisika 2 menjadi root.
Setelah diperoleh root maka akan dilihat infoa(x) dari masing nilai atribut mata
kuliah yang jadi root yaitu Fisika 2. Dari tabel di atas dapat dilihat nilai infoa(x)
Fisika2
a b c d e
Karena nilai untuk atribut Fisika 2 adalah A dan Fisika 2 adalah B, maka harus
nilai A dan Fisika 2 dengan nlai B. Tabel dibawah ini merupakan perhitungan
a 3 2 1 0.9183
b 3 1 2 0.9183
c 3 2 1 0.9183
d 3 0 3 0
e 3 0 3 0
fisika1 a 3 2 1 0.9183 0.7264 0.1919
b 3 1 1 1
c 3 1 6 0.59167
d 3 1 1 1
e 3 0 1 0
Dari tabel di atas terdapat gain untuk masing-masing mata kuliah, dimana hasil
2. Fisika 1 = 0,2516
Dari kedua mata kuliah tersebut, yang memiliki gain tertinggi adalah
node cabang dari Fisika 2 dengan nilai A. Setelah diperoleh node cabang Fisika 2
dengan nilai A maka akan dilihat infoa(x) dari masing nilai atribut mata kuliah
yang jadi node cabang Fisika 2 dengan nilai A yaitu Algoritma Pemrograman 1.
Dari tabel di atas, nilai infoa(x) untuk nilai mata kuliah Algoritma Pemrograman
1diantaranya adalah:
13
Dari hasil infoa(x) tersebut semua bernilai 0, artinya semua cabang dari nilai
mencapai leaf. Dari data tabel di atas terlihat untuk nilai atribut Algoritma
nilai atribut Algoritma Pemrograman 1 yang D dan E bernilai 0. Ini artinya dalam
data training tidak ada data yang menunjukan Fisika dasarnya A dan
dalam tree. Sedangkan untuk cabang Algoritma yang A, B dan C sudah mencapai
leaf atau keputusan akhir, dimana keputusan akhirnya adalah untuk Algoritma
Fisika2
a b c d e
algorit ? leb le le
ma ih bi
a b c
kur le kur
ang ang
Gambar 2.3 Cabang Fisika 2 dengan Nilai A
Pada tabel dibawah ini adalah perhitungan untuk Cabang Fisika 2 dengan nilai B.
a 1 1 0 0
b 1 1 0 0
c 1 1 0 0
d 0 0 0 0
e 1 0 1 0
0.5 0.3113
fisika1 a 1 1 0 0
b 1 1 0 0
c 2 1 1 1
d 1 0 0 0
e 1 0 0 0
Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).
15
Hasil perhitungan dari tabel di atas dapat diperoleh strukturnya sebagai berikut:
Fisika2
a b c d e
a b c
a b c e
kur le kur
kur kura kur leb
ang ang
Gambar di atas merupakan hasil akhir dari proses pembentukan tree. Setelah
Nugroho (2006b:61) PHP adalah singkatan dari Personal Home Page Tools,
adalah sebuah bahasa scripting yang bundle dengan HTML yang dijalankan disisi
halaman HTML dinamis dan interaktif dengan cepat dan mudah yang dihasilkan
server.
yang besar.
dengan urutan khusus seperti urut nama, kode pos, kota dan sebagainya.
barang tidak boleh negative dan pada lingkungan multiuser, tidak boleh
yang sama.
Sebuah bahasa pemodelan dapat terdiri dari pseudo-code, kode aktual, gambar,
membentuk bahasa pemodelan disebut notasi. Ada 13 jenis diagram yang terdapat
pada UML, tiap jenis diagram digunakan sesuai dengan sistem yang dibuat. Akan
tetapi UML tidak hanya sekedar diagram, UML menggambarkan sistem sebagai
5 Generalizatio
Menyatakan bahwa Use Case yang
n menunjuk sepenuhnya menggunakan
kembali semua langkah dari Use Case yang
<<include>> ditunjuk.
yang terhubung untuk mewakili suatu proses yang terjadi pada sistem. Misalnya,
salah satu diagram UML yang paling banyak digunakan.Suatu struktur sistem
sebelum dirilis untuk digunakan. bagian terberat dari pengujian perangkat lunak
terbebas dari kesalahan. Untuk menguji perangkat aplikasi yang kami akan buat
2. Kesalahan Interface.
4. Kesalahan kinerja.