Bab II
Bab II
LANDASAN TEORI
3
2.1.2 Proses Pencarian Pola
Data mining adalah salah satu bagian dari proses pencarian pola. Berikut
ini urutan proses pencarian pola:
2.1.3.1 Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari
cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data.
Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan
keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit
didukung dalam pemilihan presiden. Deskripsi dari pola dan kecendrungan sering
memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.
2.1.3.2 Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi
lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan
record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat
berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi
tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis
4
kelamin, berat badan, dan level sodium darah. Hubungan antara tekanan darah
sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan
model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus
baru lainnya.
2.1.3.3 Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa
dalam prediksi nilai dari hasil akan ada di masa mendatang.
2.1.3.4 Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan
tinggi, pendapatan sedang, dan pendapatan rendah.
2.1.3.5 Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
5
Kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang
lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain.
Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi,
mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma
pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data
menjadi kelompokkelompok yang memiliki kemiripan (homogen), yang mana
kemiripan dengan record dalam kelompok lain akan bernilai minimal.
2.1.3.6 Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul
dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang
belanja.
6
2.2 Java
Java adalah bahasa pemrograman yang dapat dijalankan di berbagai
komputer termasuk telepon genggam. Bahasa ini awalnya dibuat oleh James
Gosling saat masih bergabung di Sun Microsystems saat ini merupakan bagian
dari Oracle dan dirilis tahun 1995. Bahasa ini banyak mengadopsi sintaksis yang
terdapat pada C dan C++ namun dengan sintaksis model objek yang lebih
sederhana serta dukungan rutin-rutin aras bawah yang minimal. Aplikasi-aplikasi
berbasis java umumnya dikompilasi ke dalam p-code (bytecode) dan dapat
dijalankan pada berbagai Mesin Virtual Java (JVM). Java merupakan bahasa
pemrograman yang bersifat umum/non-spesifik (general purpose), dan secara
khusus didisain untuk memanfaatkan dependensi implementasi seminimal
mungkin. Karena fungsionalitasnya yang memungkinkan aplikasi java mampu
berjalan di beberapa platform sistem operasi yang berbeda, java dikenal pula
dengan slogannya, "Tulis sekali, jalankan di mana pun". Saat ini java merupakan
bahasa pemrograman yang paling populer digunakan, dan secara luas
dimanfaatkan dalam pengembangan berbagai jenis perangkat lunak aplikasi
ataupun aplikasi.
7
menggunakan programnya sendiri-sendiri (yang dapat diunduh dari situs
Java) untuk meninterpretasikan bytecode tersebut.
OOP (Object Oriented Programming - Pemrogram Berorientasi Objek):
Perpustakaan Kelas Yang Lengkap, Java terkenal dengan kelengkapan
library/perpustakaan (kumpulan program program yang disertakan dalam
pemrograman java) yang sangat memudahkan dalam penggunaan oleh
para pemrogram untuk membangun aplikasinya. Kelengkapan
perpustakaan ini ditambah dengan keberadaan komunitas Java yang besar
yang terus menerus membuat perpustakaan-perpustakaan baru untuk
melingkupi seluruh kebutuhan pembangunan aplikasi.
Bergaya C++:
memiliki sintaks seperti bahasa pemrograman C++ sehingga menarik
banyak pemrogram C++ untuk pindah ke Java. Saat ini pengguna Java
sangat banyak, sebagian besar adalah pemrogram C++ yang pindah ke
Java. Universitas-universitas di Amerika Serikat juga mulai berpindah
dengan mengajarkan Java kepada murid-murid yang baru karena lebih
mudah dipahami oleh murid dan dapat berguna juga bagi mereka yang
bukan mengambil jurusan komputer.
Pengumpulan sampah otomatis:
memiliki fasilitas pengaturan penggunaan memori sehingga para
pemrogram tidak perlu melakukan pengaturan memori secara langsung
(seperti halnya dalam bahasa C++ yang dipakai secara luas).
8
yang menyimpan banyak atribut bahasa tingkat tinggi, seperti nama-nama
kelas, metode, dan tipe data. Hal yang sama juga terjadi pada Microsoft
.NET Platform. Dengan demikian, algoritma yang digunakan program
akan lebih sulit disembunyikan dan mudah dibajak/direverse-engineer.
Penggunaan memori yang banyak:
Penggunaan memori untuk program berbasis Java jauh lebih besar
daripada bahasa tingkat tinggi generasi sebelumnya seperti C/C++ dan
Pascal (lebih spesifik lagi, Delphi dan Object Pascal). Biasanya ini bukan
merupakan masalah bagi pihak yang menggunakan teknologi terbaru
(karena trend memori terpasang makin murah), tetapi menjadi masalah
bagi mereka yang masih harus berkutat dengan mesin komputer berumur
lebih dari 4 tahun.[4]
2.3 MySQL
MySQL adalah sebuah perangkat lunak sistem manajemen basis data SQL
atau DBMS yang multithread, multi-user, dengan sekitar 6 juta instalasi di seluruh
dunia. MySQL AB membuat MySQL tersedia sebagai perangkat lunak gratis
dibawah lisensi GNU General Public License (GPL), tetapi mereka juga menjual
dibawah lisensi komersial untuk kasus-kasus di mana penggunaannya tidak cocok
dengan penggunaan GPL.
9
Bisa dijalankan pada spesifikasi hardware yang rendah karena lebih hemat
resource memory (dibandingkan database lain) sehingga mudah digunakan
untuk bahan pembelajaran.
Sangat diragukan dalam menangani data skala besar, karena ada beberapa
opini yang pro dan kontra terhadap kemampuan MySQL terhadap
pengolahan data yang besar.
Unjuk kerja yang tinggi dalam memproses query sederhana, dalam arti
dapat memproses lebih banyak SQL per satuan waktu.
10
MYSQL memiliki beberapa lapisan keamanan, seperti subnetmask,
nama host, dan izin akses user dengan sistem perijinan yang mendetail
serta sandi/password terenkripsi.
2.4 Netbeans
NetBeans adalah sebuah open source lingkungan pengembangan terpadu
(IDE) untuk mengembangkan dengan Java, PHP, C + +, dan bahasa pemrograman
11
lainnya. NetBeans adalah juga disebut sebagai platform komponen modular
digunakan untuk mengembangkan aplikasi Java desktop.
12