Anda di halaman 1dari 10

BAB II

LANDASAN TEORI

2.1 Data Mining


Data mining atau penggalian data merupakan proses yang
memperkerjakan satu atau lebih teknik (pola) pembelajaran komputer untuk
mengekstraksi serta menganalisis suatu pengetahuan dengan cara otomatis.
Definisi lain ialah pembelajaran berbasis induksi merupakan proses pembentukan
definisi konsep umum yang dilakukan dengan cara mengobservasi contoh spesifik
dari konsep-konsep yang akan dipelajari. Knowledge Discovery in Database
merupakan sebuah penerapan metode saintifik pada data mining. Dalam konteks
ini data mining adalah satu langkah dari proses Knowledge Discovery in
Database.[2]

Data mining mempunyai beberapa nama alternatif, walaupun definisi


eksaknya berbeda, Knowledge Discovery in Database, analisis pola, arkeologi
data, intelegensia bisnis, serta pemanenan informasi. Data mining diperlukan pada
saat data tersedia terlalu banyak (contohnya data yang didapat dari sistem basis
data perusahaan, e-commerce, data bionformatika, serta data saham), namun tidak
tahu pola apa yang bisa didapatkan.[2]

2.1.1 Faktor Dari Data Mining


Perkembangan yang sangat pesat pada bidang data mining serta teknologi
penyimpanan di berbagai bidang, yang dapat menghasilkan basis data yang terlalu
besar. Tetapi, data yang sudah dikumpulkan jarang dilihat lagi, sebab terlalu
panjang, membosankan, serta tidak menarik. Sering, keputusan yang katanya
berdasarkan data, bibuat tidak lagi berdasarkand data, namun dari intuisi para
pembuat keputusan, sehingga, lahirlah cabang ilmu data mining tersebut.

3
2.1.2 Proses Pencarian Pola
Data mining adalah salah satu bagian dari proses pencarian pola. Berikut
ini urutan proses pencarian pola:

 Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi


data yang hilang.
 Integrasi Data: yaitu menggabungkan berbagai sumber data.
 Pemilihan Data: yaitu memilih data yang relevan.
 Transformasi Data: yaitu mentransformasi data ke dalam format untuk
diproses dalam penggalian data.
 Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
 Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.
 Penyajian pola: yaitu memvisualisasi pola ke pengguna.

2.1.3 Pengelompokan Data Mining


Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang
dapat di lakukan, yaitu (Larose, 2006).

2.1.3.1 Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari
cara untuk menggambarkan pola dan kecendrungan yang terdapat dalam data.
Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menemukan
keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit
didukung dalam pemilihan presiden. Deskripsi dari pola dan kecendrungan sering
memberikan kemungkinan penjelasan untuk suatu pola atau kecendrungan.

2.1.3.2 Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi
lebih ke arah numerik dari pada ke arah kategori. Model dibangun menggunakan
record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat
berdasarkan nilai variabel prediksi. Sebagai contoh, akan dilakukan estimasi
tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis

4
kelamin, berat badan, dan level sodium darah. Hubungan antara tekanan darah
sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan
model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus
baru lainnya.

2.1.3.3 Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa
dalam prediksi nilai dari hasil akan ada di masa mendatang.

Contoh prediksi dalam bisnis dan penelitian adalah:

 Prediksi harga beras dalam tiga bulan yang akan datang.


 Prediksi presentase kenaikan kecelakaan lalu lintas tahun depan jika batas
bawah kecepatan dinaikan. Beberapa metode dan teknik yang digunakan
dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang
tepat) untuk prediksi.

2.1.3.4 Klasifikasi
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan
tinggi, pendapatan sedang, dan pendapatan rendah.

Contoh lain klasifikasi dalam bisnis dan penelitian adalah:

 Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang


curang atau bukan.
 Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan
suatu kredit yang baik atau buruk.
 Mendiagnosa penyakit seorang pasien untuk mendapatkan termasuk
kategori apa.

2.1.3.5 Pengklusteran
Pengklusteran merupakan pengelompokan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

5
Kluster adalah kumpulan record yang memiliki kemiripan suatu dengan yang
lainnya dan memiliki ketidakmiripan dengan record dalam kluster lain.

Pengklusteran berbeda dengan klasifikasi yaitu tidak adanya variabel target dalam
pengklusteran. Pengklusteran tidak mencoba untuk melakukan klasifikasi,
mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma
pengklusteran mencoba untuk melakukan pembagian terhadap keseluruhan data
menjadi kelompokkelompok yang memiliki kemiripan (homogen), yang mana
kemiripan dengan record dalam kelompok lain akan bernilai minimal.

Contoh pengklusteran dalam bisnis dan penelitian adalah:

 Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari


suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang
besar.
 Untuk tujuan audit akutansi, yaitu melakukan pemisahan terhadap prilaku
finansial dalam baik dan mencurigakan.
 Melakukan pengklusteran terhadap ekspresi dari gen, dalam jumlah besar.

2.1.3.6 Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul
dalam suatu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang
belanja.

Contoh asosiasi dalam bisnis dan penelitian adalah:

 Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang


diharapkan untuk memberikan respon positif terhadap penawaran upgrade
layanan yang diberikan.
 Menemukan barang dalam supermarket yang dibeli secara bersamaan dan
barang yang tidak pernah dibeli bersamaan.[3].

6
2.2 Java
Java adalah bahasa pemrograman yang dapat dijalankan di berbagai
komputer termasuk telepon genggam. Bahasa ini awalnya dibuat oleh James
Gosling saat masih bergabung di Sun Microsystems saat ini merupakan bagian
dari Oracle dan dirilis tahun 1995. Bahasa ini banyak mengadopsi sintaksis yang
terdapat pada C dan C++ namun dengan sintaksis model objek yang lebih
sederhana serta dukungan rutin-rutin aras bawah yang minimal. Aplikasi-aplikasi
berbasis java umumnya dikompilasi ke dalam p-code (bytecode) dan dapat
dijalankan pada berbagai Mesin Virtual Java (JVM). Java merupakan bahasa
pemrograman yang bersifat umum/non-spesifik (general purpose), dan secara
khusus didisain untuk memanfaatkan dependensi implementasi seminimal
mungkin. Karena fungsionalitasnya yang memungkinkan aplikasi java mampu
berjalan di beberapa platform sistem operasi yang berbeda, java dikenal pula
dengan slogannya, "Tulis sekali, jalankan di mana pun". Saat ini java merupakan
bahasa pemrograman yang paling populer digunakan, dan secara luas
dimanfaatkan dalam pengembangan berbagai jenis perangkat lunak aplikasi
ataupun aplikasi.

2.2.1 Kelebihan Dari Java


 Multiplatform:
Kelebihan utama dari Java ialah dapat dijalankan di beberapa platform /
sistem operasi komputer, sesuai dengan prinsip tulis sekali, jalankan di
mana saja. Dengan kelebihan ini pemrogram cukup menulis sebuah
program Java dan dikompilasi (diubah, dari bahasa yang dimengerti
manusia menjadi bahasa mesin / bytecode) sekali lalu hasilnya dapat
dijalankan di atas beberapa platform tanpa perubahan. Kelebihan ini
memungkinkan sebuah program berbasis java dikerjakan di atas operating
system Linux tetapi dijalankan dengan baik di atas Microsoft Windows.
Platform yang didukung sampai saat ini adalah Microsoft Windows,
Linux, Mac OS dan Sun Solaris. Penyebabnya adalah setiap sistem operasi

7
menggunakan programnya sendiri-sendiri (yang dapat diunduh dari situs
Java) untuk meninterpretasikan bytecode tersebut.
 OOP (Object Oriented Programming - Pemrogram Berorientasi Objek):
Perpustakaan Kelas Yang Lengkap, Java terkenal dengan kelengkapan
library/perpustakaan (kumpulan program program yang disertakan dalam
pemrograman java) yang sangat memudahkan dalam penggunaan oleh
para pemrogram untuk membangun aplikasinya. Kelengkapan
perpustakaan ini ditambah dengan keberadaan komunitas Java yang besar
yang terus menerus membuat perpustakaan-perpustakaan baru untuk
melingkupi seluruh kebutuhan pembangunan aplikasi.
 Bergaya C++:
memiliki sintaks seperti bahasa pemrograman C++ sehingga menarik
banyak pemrogram C++ untuk pindah ke Java. Saat ini pengguna Java
sangat banyak, sebagian besar adalah pemrogram C++ yang pindah ke
Java. Universitas-universitas di Amerika Serikat juga mulai berpindah
dengan mengajarkan Java kepada murid-murid yang baru karena lebih
mudah dipahami oleh murid dan dapat berguna juga bagi mereka yang
bukan mengambil jurusan komputer.
 Pengumpulan sampah otomatis:
memiliki fasilitas pengaturan penggunaan memori sehingga para
pemrogram tidak perlu melakukan pengaturan memori secara langsung
(seperti halnya dalam bahasa C++ yang dipakai secara luas).

2.2.2 Kekurangan Dari Java


 Tulis sekali, jalankan di mana saja:
Masih ada beberapa hal yang tidak kompatibel antara platform satu dengan
platform lain. Untuk J2SE, misalnya SWT-AWT bridge yang sampai
sekarang tidak berfungsi pada Mac OS X.
 Mudah didekompilasi:
Dekompilasi adalah proses membalikkan dari kode jadi menjadi kode
sumber. Ini dimungkinkan karena kode jadi Java merupakan bytecode

8
yang menyimpan banyak atribut bahasa tingkat tinggi, seperti nama-nama
kelas, metode, dan tipe data. Hal yang sama juga terjadi pada Microsoft
.NET Platform. Dengan demikian, algoritma yang digunakan program
akan lebih sulit disembunyikan dan mudah dibajak/direverse-engineer.
 Penggunaan memori yang banyak:
Penggunaan memori untuk program berbasis Java jauh lebih besar
daripada bahasa tingkat tinggi generasi sebelumnya seperti C/C++ dan
Pascal (lebih spesifik lagi, Delphi dan Object Pascal). Biasanya ini bukan
merupakan masalah bagi pihak yang menggunakan teknologi terbaru
(karena trend memori terpasang makin murah), tetapi menjadi masalah
bagi mereka yang masih harus berkutat dengan mesin komputer berumur
lebih dari 4 tahun.[4]

2.3 MySQL
MySQL adalah sebuah perangkat lunak sistem manajemen basis data SQL
atau DBMS yang multithread, multi-user, dengan sekitar 6 juta instalasi di seluruh
dunia. MySQL AB membuat MySQL tersedia sebagai perangkat lunak gratis
dibawah lisensi GNU General Public License (GPL), tetapi mereka juga menjual
dibawah lisensi komersial untuk kasus-kasus di mana penggunaannya tidak cocok
dengan penggunaan GPL.

2.3.1 Kelebihan MySQL dibanding RDBMS Lain


 Berlisensi GPL dan Multi Platform.

 Dapat diintegrasikan dengan beberapa bahasa Pemrograman seperti .Net,


Java, Python, Perl yang merupakan bahasa pemrograman yang paling
dominan di kalangan programmer.

 Mendukung ODBC untuk sistem operasi Windows sehingga bisa


digunakan aplikasi yang berjalan diwindows.

9
 Bisa dijalankan pada spesifikasi hardware yang rendah karena lebih hemat
resource memory (dibandingkan database lain) sehingga mudah digunakan
untuk bahan pembelajaran.

 MySQL dapat mendeteksi pesan kesalahan pada klien dengan


menggunakan lebih dari 20 bahasa meskipun bahasa indonesia belum
termasuk didalamnya.

2.3.2 Kekurangan MySQL dibanding RDBMS Lain


 Banyak mengklaim kurang support terhadap pemrograman
Visual/Desktop, sehingga sedikit yang menggunakan untuk aplikasi visual.

 Karena berlisensi GPL sehingga sulit mendapatkan update


untuk problem yang urgent, sehingga perusahaan skala menengah keatas
lebih memilih RDBMS berlisensi dan disupport seperti Oracle dan MS
SQL Server

 Sangat diragukan dalam menangani data skala besar, karena ada beberapa
opini yang pro dan kontra terhadap kemampuan MySQL terhadap
pengolahan data yang besar.

2.3.3 Kemampuan MySQL


Berikut Fitur serta kapabilitas yang dimiliki oleh MySQL:

 Unjuk kerja yang tinggi dalam memproses query sederhana, dalam arti
dapat memproses lebih banyak SQL per satuan waktu.

 Memiliki lebih banyak tipe data seperti : signed/unsigned integer yang


memiliki panjang data sebesar 1,2,3,4 dan 8 byte, FLOAT, DOUBLE,
CHAR, VARCHAR, TEXT, BLOB, DATE, TIME, DATETIME,
TIMESTAMP, YEAR, SET dan tipe ENUM.

 Mendukung field yang dijadikan Index, dengan maksimal 32 index dalam


satu tabel. *

10
 MYSQL memiliki beberapa lapisan keamanan, seperti subnetmask,
nama host, dan izin akses user dengan sistem perijinan yang mendetail
serta sandi/password terenkripsi.

 Konektivitas , MySQL dapat melakukan koneksi dengan klien


menggunakan protokol TCP/IP ,Unix soket (UNIX),atau Named
Pipes(NT).

 Multi-user. MySQL dapat digunakan oleh beberapa pengguna dalam


waktu yang bersamaan tanpa mengalami masalah atau konflik

 Command and function, MySQL memiliki fungsi dan operator secara


penuh yang mendukung perintah select dan where dalam query.

 Structure Table, MySQL memiliki struktur tabel yang lebih fleksibel


dalam menangani ALTER TABLE dibandingkan DBMS lainnya.

 Mendukung penuh terhadap kalimat SQL GROUP BY dan ORDER BY.


Mendukung terhadap fungsi penuh ( COUNT(),COUNT(), DISTINCT()
AVG(), STD(), SUM(), MAX() dan MIN() )

2.3.4 Bahasa pemrograman


Terdapat beberapa API (Application Programming Interface) tersedia yang
memungkinkan aplikasi-aplikasi komputer yang ditulis dalam berbagai bahasa
pemrograman untuk dapat mengakses basis data MySQL antara lain: bahasa
pemrograman C, C++, C#, bahasa pemrograman Eiffel, bahasa pemrograman
Smalltalk, bahasa pemrograman Java, bahasa pemrograman Lisp, Perl, PHP,
bahasa pemrograman Python, Ruby, REALbasic dan Tcl. Sebuah antarmuka
ODBC memanggil MyODBC yang memungkinkan setiap bahasa pemrograman
yang mendukung ODBC untuk berkomunikasi dengan basis data MySQL. [5]

2.4 Netbeans
NetBeans adalah sebuah open source lingkungan pengembangan terpadu
(IDE) untuk mengembangkan dengan Java, PHP, C + +, dan bahasa pemrograman

11
lainnya. NetBeans adalah juga disebut sebagai platform komponen modular
digunakan untuk mengembangkan aplikasi Java desktop.

NetBeans menggunakan komponen, juga dikenal sebagai modul, untuk


memungkinkan pengembangan perangkat lunak. NetBeans menginstal modul
secara dinamis dan memungkinkan pengguna untuk men-download fitur update
dan upgrade digital dikonfirmasi. NetBeans IDE NetBeans Profiler termasuk
modul, Graphical User Interface (GUI) alat desain, dan NetBeans JavaScript
Editor.

NetBeans menyederhanakan kerangka usabilitas Java swing


pengembangan aplikasi desktop yang, yang menyediakan kemampuan platform
yang ekstensi untuk pengembang pihak ketiga.

12

Anda mungkin juga menyukai