Anda di halaman 1dari 17

BAB II

TINJAUAN PUSTAKA

2.1 Kerangka Pikir

Untuk lebih memperjelas kerangka pikir yang disajikan, maka digambarkan

dalam bentuk diagram pada gambar 2.1 sebagai berikut :

Pengadilan tinggi Sul-Sel adalah lembaga khusus negara yang berada


di bawah naungan kementrian hukum dan ham. didirikan tanggal 1
April 1949.

Belum tersedia aplikasi pelaporan dan analisis analisis kegiatan


perceraian dibawah umur pada kantor Pengadilan Agama Kelas 1A

Merancang aplikasi pelaporan dan analisis yang bisa berjalan pada


sebuah sistem pelaporan menggunakan metode klasifikasi data
mining C4.5

Dengan adanya aplikasi analisis berbasis diharapkan calon cerai dapat


menyelesaikan prosesi mediasi panitera dengan melihat langsung hasil
analisis dari sekumpulan data perceraian secara real time

Gambar 2.1 Kerangka Pikir

6
7

2.2 Landasan Teori

2.2.1 Konsep Dasar Aplikasi

2.2.1.1 Pengertian Aplikasi

Menurut Jugiyanto H.M (2010:20), aplikasi adalah penggunaan dalam

suatu komputer, instruksi atau pernyataan yang disusun sedemikian rupa sehingga

komputer dapat memproses input menjadi output.

Aplikasi adalah software yang dibeli perusahaan dari tempat pembuatnya.

Aplikasi akan menggunakan sistem operasi (OS) komputer dan aplikasi yang

lainnya yang mendukung. Istilah ini mulai perlahan masuk ke dalam istilah

Teknologi Informasi semenjak tahun 1993, yang biasanya juga disingkat dengan

App. Secara historis, aplikasi adalah software yang dikembangkan oleh sebuah

perusahaan. App Industri PC tampaknya menciptakan istilah ini untuk

merefleksikan medan pertempuran persaingan yang baru.

2.2.2 Konsep dasar pengelompokan data

2.2.2.1 Pengertian Data Mining

Data mining merupakan salah satu proses inti yang terdapat dalam KDD.

Banyak orang memperlakukan data mining sebagai sinonim dari KDD, karena

sebagian besar pekerjaan dalam KDD difokuskan pada data mining. Namun,

langkah-langkah lain merupakan proses-proses penting yang menjamin

kesuksesan dari aplikasi KDD. Data mining adalah kegiatan yang meliputi

pengumpulan, pemakaian data historis yang menemukan keteraturan, pola dan

hubungan dalam set data berukuran besar . Maksud dari pengertian ini yaitu
8

proses pencarian informasi yang tidak diketahui sebelumnya dari sekumpulan data

besar. Menurut Lutfhi, E. T (2009:32) karakteristik data mining sebagai berikut :

1. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi dan

pola data tertentu yang tidak diketahui sebelumnya. .

2. Data mining biasa menggunakan data yang sangat besar. Biasanya data yang

besar digunakan untuk membuat hasil lebih dipercaya.

3. Data mining berguna untuk membuat keputusan

Sumber: Lutfhi, E. T (2009). Algoritma Data Mining

2.2.2.2 Klasifikasi

Klasifikasi data merupakan suatu proses yang menemukan properti-properti

yang sama pada sebuah himpunan obyek di dalam sebuah basis data dan

mengklasifikasikannya ke dalam kelas-kelas yang berbeda menurut model

klasifikasi yang ditetapkan. Tujuan dari klasifikasi adalah untuk menemukan

model dari training set yang membedakan atribut ke dalam kategori atau kelas

yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan

atribut yang kelasnya belum diketahui sebelumnya. Teknik klasifikasi terbagi

menjadi beberapa teknik yang diantaranya adalah Pohon Keputusan.

2.2.3 Algoritma C4.5

Jefri (2013:3) Algoritma C4.5 adalah algoritma klasifikasi data dengan

teknik pohon keputusan yang terkenal dan disukai karena memiliki kelebihan-

kelebihan. Kelebihan ini misalnya dapat mengolah data numerik (kontinyu) dan

diskret, dapat menangani nilai atribut yang hilang, menghasilkan aturan-aturan


9

yang mudah diintrepetasikan dan tercepat diantara algoritma-algoritma yang lain.

Keakuratan prediksi yaitu kemampuan model untuk dapat memprediksi label

kelas terhadap data baru atau yang belum diketahui sebelumnya dengan baik.

Dalam hal kecepatan atau efisiensi waktu komputasi yang diperlukan untuk

membuat dan menggunakan model. Kemampuan model untuk memprediksi

dengan benar walaupun data ada nilai dari atribut yang hilang. Dan juga

skalabilitas yaitu kemampuan untuk membangun model secara efisien untuk data

berjumlah besar (aspek ini akan mendapatkan penekanan). Terakhir

interpretabilitas yaitu model yang dihasilkan mudah dipahami . Pada tahap

pembelajaran algoritma C4.5 memiliki 2 prinsip kerja yaitu:

1. Pembuatan pohon keputusan. Tujuan dari algoritma penginduksi

pohon keputusan adalah mengkontruksi struktur data pohon yang

dapat digunakan untuk memprediksi kelas dari sebuah kasus atau

record baru yang belum memiliki kelas. C4.5 melakukan konstruksi

pohon keputusan dengan metode divide and conquer. Pada awalnya

hanya dibuat node akar dengan menerapkan algoritma divide and

conquer. Algoritma ini memilih pemecahan kasus-kasus yang terbaik

dengan menghitung dan membandingkan gain ratio, kemudian node-

node yang terbentuk di level berikutnya, algoritma divide and conquer

akan diterapkan lagi sampai terbentuk daun-daun.

2. Pembuatan aturan-aturan (rule set). Aturan-aturan yang terbentuk dari

pohon keputusan akan membentuk suatu kondisi dalam bentuk if-then.

Aturan-aturan ini didapat dengan cara menelusuri pohon keputusan


10

dari akar sampai daun. Setiap node dan syarat percabangan akan

membentuk suatu kondisi atau suatu if, sedangkan untuk nilai-nilai

yang terdapat pada daun akan membentuk suatu hasil atau suatu then.

2.2.3.1 Contoh Kasus Algoritma C4.5

Perhitungan berdasarkan kasus data nilai mata kuliah mahasiswa untuk

menentukan masa studi dilakukan dengan mengimplementasikan Algoritma C4.5

terlihat pada tabel di bawah ini.Perhitungan akan dilakukan berdasarkan 3 nilai

mata kuliah yaitu : Algoritma Pemrograman 1, Fisika 1 dan Fisika 2. Dengan nilai

masing-masing mata kuliah adalah A, B, C, D dan E. Mata kuiah ini dijadikan

atribut awal dalam implementasi Algoritma C4.5 dan atribut tujuannya adalah

masa studi dengan nilai dari atribut masa studi adalah “kurang” dan “lebih”.

Kurang artinya lulus kurang dari lima tahun dan lebih artinya lulus lebih dari lima

tahun.

Tabel 2.1 Contoh Kasus Algoritma C4.5

node jml kurang lebih info(x) e(x) gain


kasus
1 algoritma 15 5 10 0.9183 0.551 0.3673
1

a 3 2 1 0.9183
b 3 1 2 0.9183
c 3 2 1 0.9183
d 3 0 3 0
e 3 0 3 0
fisika1 a 3 2 1 0.9183 0.7264 0.1919
b 3 1 1 1
c 3 1 6 0.59167
d 3 1 1 1
e 3 0 1 0
fisika2 a 3 2 1 0.9183 0.4 0.5183
b 4 3 1 0.81128
c 3 0 3 0
d 4 0 4 0
e 1 0 1 0

Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).


11

Dari tabel di atas terdapat gain untuk masing-masing mata kuliah. Dimana hasil

gain dari masing-masing mata kuliah tersebut diantaranya adalah: algoritma

Pemrograman 1 = 0,3673, Fisika 1 = 0,1919 dan Fisika 2 = 0,5183 Sesuai dengan

ketentuan dalam algoritma C4.5, setiap atribut yang memiliki gain tertinggi akan

menjadi root atau node. Dari ketiga mata kuliah tersebut, matakuliah yang

memiliki gain tertinggi adalah Fisika 2, maka mata kuliah Fisika 2 menjadi root.

Setelah diperoleh root maka akan dilihat infoa(x) dari masing nilai atribut mata

kuliah yang jadi root yaitu Fisika 2. Dari tabel di atas dapat dilihat nilai infoa(x)

untuk nilai mata kuliah Fisika 2 diantaranya adalah:

1. Fisika 2 dengan nilai A : 0,9183

2. Fisika 2 dengan nilai B : 0,81128

3. Fisika 2 dengan nilai C : 0

4. Fisika 2 dengan nilai D : 0

5. Fisika 2 dengan nilai E : 0

Hasil tree dari perhitungan yang pertama adalah sebagai berikut:

Fisika2

a b c d e

? ? lebi lebi lebi


h
Gambar 2. 2 Root danh Cabangnya

Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).


12

Karena nilai untuk atribut Fisika 2 adalah A dan Fisika 2 adalah B, maka harus

dilakukan perhitungan kembali untuk menentukan node cabang Fisika 2 dengan

nilai A dan Fisika 2 dengan nlai B. Tabel dibawah ini merupakan perhitungan

untuk cabang Fisika 2 dengan nilai A.

Tabel 2. 2 Perhitungan Cabang Fisika 2 dengan Nilai A

node jml kurang lebih info(x) e(x) gain


kasus
1 algoritma 1 15 5 10 0.9183 0.551 0.3673

a 3 2 1 0.9183
b 3 1 2 0.9183
c 3 2 1 0.9183
d 3 0 3 0
e 3 0 3 0
fisika1 a 3 2 1 0.9183 0.7264 0.1919
b 3 1 1 1
c 3 1 6 0.59167
d 3 1 1 1
e 3 0 1 0

Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).

Dari tabel di atas terdapat gain untuk masing-masing mata kuliah, dimana hasil

gain dari masing-masing mata kuliah tersebut diantaranya adalah:

1. Algoritma Pemrograman 1 = 0,9183

2. Fisika 1 = 0,2516

Dari kedua mata kuliah tersebut, yang memiliki gain tertinggi adalah

Algoritma Pemrograman 1, maka Algoritma Pemrograman 1 yang akan menjadi

node cabang dari Fisika 2 dengan nilai A. Setelah diperoleh node cabang Fisika 2

dengan nilai A maka akan dilihat infoa(x) dari masing nilai atribut mata kuliah

yang jadi node cabang Fisika 2 dengan nilai A yaitu Algoritma Pemrograman 1.

Dari tabel di atas, nilai infoa(x) untuk nilai mata kuliah Algoritma Pemrograman

1diantaranya adalah:
13

1. Algoritma Pemrograman 1 dengan nilai A : 0

2. Algoritma Pemrograman 1 dengan nilai B : 0

3. Algoritma Pemrograman 1 dengan nilai C : 0

4. Algoritma Pemrograman 1 dengan nilai D : 0

5. Algoritma Pemrograman 1 dengan nilai E : 0

Dari hasil infoa(x) tersebut semua bernilai 0, artinya semua cabang dari nilai

mata kuliah Algoritma Pemrograman 1 sudah mencapai keputusan akhir atau

mencapai leaf. Dari data tabel di atas terlihat untuk nilai atribut Algoritma

Pemrograman 1 dengan nilai A, B, dan C memiliki jumlah data, namun untuk

nilai atribut Algoritma Pemrograman 1 yang D dan E bernilai 0. Ini artinya dalam

data training tidak ada data yang menunjukan Fisika dasarnya A dan

Algoritmanya D dan E. Sehingga untuk cabang Algoritma D dan E tidak ada

dalam tree. Sedangkan untuk cabang Algoritma yang A, B dan C sudah mencapai

leaf atau keputusan akhir, dimana keputusan akhirnya adalah untuk Algoritma

Pemrograman 1 yang nilainya A adalah “kurang”, Algoritma Pemrograman 1

yang nilainya B adalah “lebih” dan Algoritma Pemrograman 1 yang C adalah

kurang”. Hasil dari perhitungan tabel di atas:


14

Fisika2

a b c d e

algorit ? leb le le
ma ih bi

a b c

kur le kur
ang ang
Gambar 2.3 Cabang Fisika 2 dengan Nilai A

Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).

Pada tabel dibawah ini adalah perhitungan untuk Cabang Fisika 2 dengan nilai B.

Tabel 2.3 Perhitungan Cabang Fisika 2 dengan Nilai B

node Fisika2(b) jml kurang lebih info(x) e(x) gain


kasus
2 algoritma 1 4 3 1 0.281128 0 0.8113

a 1 1 0 0
b 1 1 0 0
c 1 1 0 0
d 0 0 0 0
e 1 0 1 0
0.5 0.3113
fisika1 a 1 1 0 0
b 1 1 0 0
c 2 1 1 1
d 1 0 0 0
e 1 0 0 0
Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).
15

Hasil perhitungan dari tabel di atas dapat diperoleh strukturnya sebagai berikut:

Fisika2

a b c d e

algorit algori leb le le


ma tma bi

a b c
a b c e

kur le kur
kur kura kur leb
ang ang

Gambar 2. 2 Cabang Fisika 2 dengan Nilai B

Sumber: Algoritma Data Mining – , & Lutfhi, E. T (2009).

Gambar di atas merupakan hasil akhir dari proses pembentukan tree. Setelah

selesai pembentukan tree merupakan proses pembuatan aturan berdasarkan tree

yang terbentuk. Aturan dari tree di atas adalah sebagai berikut:

1. Jika Fisika 2 nilai A dan Algoritma Pemrograman 1 nilai A maka masa

studinya adalah kurang

2. Jika Fisika 2 nilai A dan Algoritma Pemrograman 1 nilai B maka masa

studinya adalah lebih

3. Jika Fisika 2 nilai A dan Algoritma Pemrograman 1 nilai C maka masa

studinya adalah kurang

4. Jika Fisika 2 nilai B dan Algoritma Pemrograman 1 nilai A maka masa

studinya adalah kurang


16

5. Jika Fisika 2 nilai B dan Algoritma Pemrograman 1 nilai B maka masa

studinya adalah kurang

6. Jika Fisika 2 nilai B dan Algoritma Pemrograman 1 nilai C maka masa

studinya adalah kurang

7. Jika Fisika 2 nilai B dan Algoritma Pemrograman 1 nilai E maka masa

studinya adalah lebih

8. Jika Fisika 2 nilai C maka masa studinya adalah lebih

9. Jika Fisika 2 nilai D maka masa studinya adalah lebih

10. Jika Fisika 2 nilai E maka masa studinya adalah lebih

2.2.4 PHP (Personal Home Page)

Nugroho (2006b:61) PHP adalah singkatan dari Personal Home Page Tools,

adalah sebuah bahasa scripting yang bundle dengan HTML yang dijalankan disisi

server. Bahasa ini memungkinkan para pembuat aplikasi web menyajikan

halaman HTML dinamis dan interaktif dengan cepat dan mudah yang dihasilkan

server.

2.2.5 Basis Data (Database)

Menurut Aryo Suryo Kusumo (2002:6), Database adalah kumpulan

informasi. Untuk mengelola database diperlukan program manajer database atau

lebih dikenal sebagai database management system (DBMS).


17

Umumnya program manajer database memiliki kemampuan :

1. Kapasitas besar memiliki kemampuan untuk menangani data dalam jumlah

yang besar.

2. Pencarian dapat menampilkan (querying) informasi sesuai kriteria tertentu,

misalnya “Data mahasiswa yang berasal dari kota Surabaya”.

3. Pengurutan/Sort menunjuk pada kemampuan untuk menyusun informasi

dengan urutan khusus seperti urut nama, kode pos, kota dan sebagainya.

4. Laporan menghasilkan laporan dengan format tertentu. Termasuk

didalamnya menambah headings, suheadings, summary, menghitung field,

dan menghasilkan laporan dari query.

5. Entri data/modifikasi/menghapus depirlukan akurasi dan validasi dari

informasi atau dikenal sebagai “integritas data”. Sebagai contoh stok

barang tidak boleh negative dan pada lingkungan multiuser, tidak boleh

pada waktu bersamaan beberapa pemakai mencoba mengubah informasi

yang sama.

2.2.6 Unified Modeling Language (UML)

Menurut Kim Hamilton and Russell Miles (2006:3) Unified Modeling

Language adalah bahasa pemodelan standar untuk perangkat lunak dan

pengembangan sistem.Pernyataan ini sendiri adalah argumen yang cukup

meyakinkan untuk membuat UML bagian dari perbendaharaan perangkat lunak.

Sebuah bahasa pemodelan dapat terdiri dari pseudo-code, kode aktual, gambar,

diagram atau bagian-bagian deskripsi yang panjang. Unsur-unsur yang


18

membentuk bahasa pemodelan disebut notasi. Ada 13 jenis diagram yang terdapat

pada UML, tiap jenis diagram digunakan sesuai dengan sistem yang dibuat. Akan

tetapi UML tidak hanya sekedar diagram, UML menggambarkan sistem sebagai

model diagram, yang sebenarnya hanya jendela ke dalam model itu.

2.2.6.1 Use Case Diagram

Use-case adalah kasus atau situasi dimana sistem digunakan untuk

memenuhi satu atau lebih dari kebutuhan pengguna, suatu use-case

menggambarkan bagian-bagian fungsional yang disebabkan oleh sistem.

Table 2.4 Simbol-simbol pada Use Case Diagram.

NO SIMBOL NAMA KETERANGAN

1 Actor Sesuatu yang berinteraksi dengan sistem dan


tidak dapat digantikan dengan desain sistem.

2 Use Case Menggambarkan interaksi yang mewakili

3 Communicati Menghubungkan Actor dan Use Case untuk


on menunjukkan bahwa Actor tersebut
berpartisipasi pada Use Case tersebut.

4 System Sebagai batasan bahwa adanya Actor


Boundaries eksternal yang berinteraksi dengan Use Case
internal.

5 Generalizatio
Menyatakan bahwa Use Case yang
n menunjuk sepenuhnya menggunakan
kembali semua langkah dari Use Case yang
<<include>> ditunjuk.

6 Special Case Menyatakan bahwa use case yang menunjuk


adalah khusus dengan Use Case yang lebih
umum.

Sumber: UML 2.0 – Kim Hamilton & Russel Miles (2006)


19

2.2.6.2 Activity Diagram

ActivityDiagram dapat digunakan untuk menentukan bagaimana sistem

akan mencapai tujuannya. Activitydiagram memperlihatkan tindakan level tinggi

yang terhubung untuk mewakili suatu proses yang terjadi pada sistem. Misalnya,

activitydiagram dapat digunakan dalam langkah-langkah yang terjadi pada proses

pembuatan akun blog.

Table 2.5 Simbol-simbol pada ActivityDiagram

NO SIMBOL NAMA KETERANGAN

1 Initial Node Tanda aktifitas dimulai.

2 Action Langkah penting yang terjadi dalam


aktifitas. Bias jadi perilaku yang dilakukan,
perhitungan, atau langkah kunci dalam
proses.

3 Edge/Path Mengarahkan satu aksi ke aksi selanjutnya.

4 Activity Digunakan untuk menampung beberapa aksi


frame yang membentuk suatu aktifitas. Digunakan
apabila diagram mempunyai lebih dari satu
aktifitas.

5 Decision Digunakan apabila aksi berikutnya


ditentukan oleh kondisi tertentu. Memiliki
satu input edge. Setiap keluaran memiliki
kata kondisi.

6 Fork Node Menyatukan atau membagi edge sesuai


dengan tujuan atau sumber aksi.

7 Time Events Memberitahukan penggunaan waktu yang


dianggap lama dari suatu aksi ke aksi lain.

8 Objects Menggambarkan sebuah objek penting yang


terlibat antara 2 aksi

9 Final Node Tanda berakhirnya aktifitas.


Sumber: UML 2.0 – Kim Hamilton & Russel Miles (2006).
20

2.2.6.3 Class Diagram

Classes menggambarkan berbagai jenis objek yang diperlukan dalam sistem

untuk memenuhi kebutuhan. Pengklasifikasian merupakan jantung dari setiap

sistem yang berorientasi objek, hal itu mengakibatkan ClassDiagram menjadi

salah satu diagram UML yang paling banyak digunakan.Suatu struktur sistem

terbuat dari berbagai kumpulan bagian yang biasa disebut

objek.Classesmenggambarkan berbagai jenis objek yang dimiliki oleh sistem dan

class diagram menampilkan dan menunjukkan keterhubungannya. Berikut

beberapa simbol pada class diagram:

Table 2.6 Simbol-simbol pada Class Diagram

NO SIMBOL NAMA KETERANGAN

1 Class Class digunakan untuk menggambarkan


bagaimana objek terbentuk. Baris
pertama adalah Nama Class/objek, baris
kedua merupakan atribut-atribut dari
objek..

2 Package Sebagai tempat untuk menaruh class-


class yang berada pada paket yang
sama.

3 Attribute Bagian informasi yang memberitahukan


keadaan objek.

4 Association Penghubung antar class yang berkaitan


dan saling berinteraksi.

5 Dependency Digunakan ketika objek dari sebuah


kelas bekerja secara ringkas dengan
objek dari kelas lain.

Sumber: UML 2.0 – Kim Hamilton & Russel Miles (2006).


21

2.2.7 Teknik Pengujian Perangkat Lunak

Menurut Roger S. Pressman (2001:81) pengujian dilakukan dibagian akhir

dalam proses perancangan dan pengembangan perangkat lunak juga merupakan

kesempatan terakhir untuk mengetahui kelemahan dan kesalahan perangkat lunak

sebelum dirilis untuk digunakan. bagian terberat dari pengujian perangkat lunak

adalah memahami bagaimana melakukan pengujian secara menyeluruh, dan

pentingnya menyadari bahwa pengujian tidak dapat menjamin bahwa program

terbebas dari kesalahan. Untuk menguji perangkat aplikasi yang kami akan buat

penulis akan menggunakan tehnik pengujian black box.

2.2.8. Pengujian Black Box Testing

Menurut Roger S. Pressman (2012:298) “Pengujian Black-Box berfokus

pada persyaratan fungsional perangkat lunak. Pengujian Black-Box

memungkinkan perekayasa perangkat lunak mendapatkan serangkaian kondisi

input yang sepenuhnya menggunakan semua persyaratan fungsional untuk suatu

program”. Pengujian Black-Box bukan merupakan alternative dari teknik White-

Box, tetapi merupakan pendekatan komplementer yang kemungkinan besar

mampu mengungkap kelas kesalahan daripada metode white-box. Pengujian

Black–Box berusaha menemukan kesalahan dalam kategori sebagai berikut;

1. Fungsi-fungsi yang tidak benar atau hilang.

2. Kesalahan Interface.

3. Kesalahan dalam struktur data atau akses database eksternal.

4. Kesalahan kinerja.

5. Inisialisasi dan kesalahan terminasi.


22

Pengujian Black-box cenderung diaplikasikan selama tahap akhir pengujian,

karena pengujian black-box memperhatikan struktur control maka perhatian

berfokus pada domain informasi.

Anda mungkin juga menyukai