Bab Ii

8
BAB II
LANDASAN TEORI
A. Dasar Teori
1. Data Mining
Istilah data mining sudah berkembang jauh dalam mengadaptasi setiap
bentuk analisa data. Pada dasarnya data mining berhubungan dengan analisa data dan
penggunaan teknik-teknik perangkat lunak untuk mencari pola dan keteraturan dalam
himpunan data yang sifatnya tersembunyi.
Dengan diperolehnya informasi-informasi yang berguna dari data yang ada,
hubungan antara item dalam transaksi, maupun informasi informasi-yang potensial,
selanjutnya dapat diekstrak dan dianalisa serta diteliti lebih lanjut dari berbagai sudut
pandang. Informasi yang ditemukan ini selanjutnya dapat diaplikasikan untuk aplikasi
manajemen, melakukan query processing, pengambilan keputusan dan lain
sebagainya. Dengan semakin berkembangnya kebutuhan akan informasi-informasi,
semakin banyak pula bidang-bidang yang rnenerapkan konsep data mining.
Beberapa pengertian data mining yang dikemukakan oleh para ahli di bidang
ini adalah sebagai berikut :
a.
(Davies, 2004 dalam (Wirdasari Dian, 2011: 139)), pengertian data mining
dimaknai sebagai berikut:
Secara sederhana data mining adalah penambangan atau penemuan

informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data
yang sangat besar .
b. Sedangkan (Jiawei, 2011: 18), mengartikan data mining sebagai berikut:
Data mining adalah kegiatan menemukan pola yang menarik dari data dalam
jumlah besar, data dapat disimpan dalam database, data warehouse, atau
penyimpanan informasi lainnya yang masih berkaitan dengan bidang ilmuilmu lain, seperti database system, data warehousing, statistik, machine
learning, information retrieval, dan komputasi tingkat tinggi. Selain itu, data
mining didukung oleh ilmu lain seperti neural network, pengenalan pola,
spatial data analysis, image database, signal processing.
c. Dan menurut (Susanto & Suryadi, 2010: 2) istilah data mining sebagai berikut:
knowledge discovery ataupun pattern recognition sebenarnya memiliki
ketepatannya masing-masing. Istilah knowledge discovery atau penemuan
pengetahuan tepat digunakan karena tujuan utama dari data mining memang
untuk mendapatkan pengetahuan yang masih tersembunyi di dalam
bongkahan data. Istilah pattern recognition atau pengenalah pola pun tetap
untuk digunakan karena pengetahuan yang hendak digali memang berbentuk
pola-pola yang mungkin juga masih perlu digali dari dalam bongkahan data
yang tengah dihadapi. Banyak definisi bagi istilah data mining dan belum
ada yang dibakukan atau disepakati semua pihak. Namun demikian, istilah
data mining ini memiliki hakikat (notion) sebagai disiplin ilmu yang tujuan
utamanya adalah untuk menemukan, menggali, atau menambang
pengetahuan dari data atau informasi yang kita miliki. Kegiatan inilah yang
menjadi garapan atau perhatian utama dari disiplin ilmu data mining
Berdasarkan beberapa pengertian di atas dapat ditarik kesimpulan bahwa
data mining adalah suatu teknik di dalam menggali informasi berharga yang
terpendam atau tersembunyi pada suatu koleksi data (database) yang sangat besar
sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak diketahui.
Menurut (Mujib & Hadi, 2013: 60) Ada beberapa teknik yang dimiliki data
mining berdasarkan tugas yang bisa dilakukan,yaitu:
a. Deskripsi
10
b.
c.
d.
e.
Para peneliti biasanya mencoba menemukan cara untuk mendeskripsikan

pola dan trend yang tersembunyi dalam data.
Estimasi
Estimasi mirip dengan klasifikasi, kecuali variabel tujuan yang lebih
kearah numerik dari pada kategori.
Klasifikasi
Dalam klasifikasi variabel, tujuan bersifat kategorik. Misalnya, kita akan
mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
Clustering
Clustering lebih ke arah pengelompokan record , pengamatan, atau kasus
dalam kelas yang memiliki kemiripan.
Asosiasi
Mengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada
satu waktu.
2. Association Rule
Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang
menjadi dasar dari berbagai teknik data mining lainnya, khususnya analisis pola
frekuensi tinggi (frequent pattern mining).
Teknik asosiasi menarik perhatian banyak peneliti karena mampu
menghasilkan algoritma yang efisien (Emha, 2009: 150).
Menurut Shuruti Aggarwal dalam (Tampubolon Kennedi, 2013: 93) ada
beberapa algoritma yang termasuk dalam Aturan Asosiasi yaitu sebagai berikut:
AIS Algorithm, Apriori Algorithm, DHP Algorithm, dan Partition
Algorithm.
Metodologi dasar analisis asosiasi terbagi menjadi dua tahap:
1. Analisa pola frekuensi tinggi
Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai
support dalam database. Nilai support sebuah item diperoleh dengan memakai rumus
berikut:
11
Support (A) = Jumlah Transaksi Mengandung A

Total Transaksi
Sedangkan nilai dari support dua item diperoleh dari rumus berikut :
Support (A,B) = (AB) = Jumlah Transaksi Mengandung A dan B
Total Transaksi
2. Pembentukan Aturan Asosiasi
Setelah semua pola frekuensi tinggi ditemukan, barulah dicari aturan
assosiatif yang memenuhi syarat minimum untuk confidence dengan menghitung
confidence aturan asosiasi jika A maka B . Nilai confidence dari aturan jika A
maka B diperoleh dari rumus berikut :
Confidence = P(B|A) = Jumlah Transaksi Mengandung A dan B
Jumlah Transaksi Mengandung A
3. Algoritma Apriori
Algoritma apriori adalah suatu algoritma dasar yang diusulkan oleh Agrawal
& Srikant pada tahun 1994 untuk menentukan Frequent itemsets untuk aturan asosiasi
Boolean. Analisis asosiasi atau association rule mining adalah teknik data mining
untuk menemukan aturan assosiatif antara suatu kombinasi item. Algoritma apriori
termasuk jenis aturan assosiasi pada data mining yang menyatakan asosiasi antara
beberapa atribut yang sering disebut sebagai affinity analysis atau market basket
analysis. Contoh dari aturan assosiatif di pasar swalayan dapat diketahuinya berapa
besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu. Dengan
pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya
atau merancang kampanye pemasaran dengan memakai kupon diskon untuk
kombinasi barang tertentu.
12
Penting tidaknya suatu aturan assosiatif menurut (Kusrini & Emha, 2009:
150) dapat diketahui sebagai berikut:
dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi
item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya
hubungan antar item dalam aturan asosiasi.
Kelebihan Algoritma Apriori menurut (Erwin, 2009: 26) yaitu:
mudah untuk dipahami dan dimplementasikan dibandingkan dengan
algoritma yang lainnya yang memang diterapkan untuk proses association
rule.
Algoritma apriori dibagi menjadi beberapa tahap yang disebut narasi atau
pass menururt (Devi dinda setiawan, dalam (Buulolo, 2013: 75)).
1. Pembentukan kandidat itemset.
Kandidat k-itemset dibentuk dari kombinasi (k-1)- itemset yang didapat dari
iterasi sebelumnya. Satu cara dari algoritma apriori adalah pemangkasan
kandidat k-itemset yang subsetnya berisi k-1 item tidak termasuk dalam pola
frekuensi tinggi dengan panjang k-1.
2. Penghitungan support dari tiap kandidat k-itemset.
Support dari tiap kandidat k-itemset didapat dengan menscan database untuk
menghitung jumlah transaksi yang memuat semua item didalam kandidat kitemset tersebut. Ini adalah juga ciri dari algoritma apriori dimana diperlukan
penghitungan dengan cara seluruh database sebanyak k-itemset terpanjang.
3. Tetapkan pola frekuensi tinggi.
Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari
kandidat k-itemset yang supportnya lebih besar dari minimum support.
4. Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses
dihentikan. Bila tidak, maka k ditambah satu dan kembali bagian 1.
Untuk lebih memahami proses algoritma Apriori maka berikut ini akan
diberikan ilustrasi penggunaan algoritma Apriori.
13
Gambar 2.1 : FlowChart Algoritma Apriori (Buulolo, 2013: 75)
4. Perangkat Lunak Pendukung

a. Database
Menurut (Agnes, Triyuliana Heni (Ed.), 2007: 2) Aplikasi Manajemen
Database Pendidikan Berbasis Web dengan PHP dan MYSQL Database dapat
berarti:
Database adalah sekumpulan data yang terdiri dari satu atau lebih tabel
yang saling berhubungan. Anda atau user mempunyai wewenang untuk
mengakses data tersebut, baik untuk menambah, mengubah, atau
menghapus data yang ada dalam tabel tersebut.
b. Delphi
Menurut (Alam, 2003: 15) Pengertian Delphi yaitu :
14
Delphi merupakan paket bahasa pemrograman yang bekerja dalam

sistem operasi windows yang mempunyai cakupan kemampuan yang
luas dan sangat canggih. Berbagai jenis aplikasi dapat dibuat dengan
Delphi , termasuk aplikasi untuk mengolah teks, grafik, angka, database
dan aplikasi web.
Secara umum kemampuan Delphi
adalah menyediakan komponen-
komponen dan bahasa pemrograman yang andal, sehingga memungkinkan untuk

membuat program aplikasi sesuai dengan keinginan, dengan tampilan dan
kemampuan yang canggih.
Untuk mempermudah pemrograman dalam membuat program aplikasi,
Delphi
menyediakan fasilitas pemrograman yang sangat lengkap. Fasilitas
pemrograman tersebut dibagi dalam dua kelompok, yaitu object dan bahasa
pemrograman. Secara ringkas, object adalah suatu komponen yang mempunyai
bentuk fisik dan biasanya dapat dilihat (visual). Object biasanya dipakai untuk
melakukan tugas tertentu dan mempunyai batasan-batasan tertentu. Sedangkan
bahsa pemrograman secar singkat dapat disebut sebagai sekumpulan teks yang
mempunyai arti tertentu dan disusun dengan aturan tertentu serta untuk
menjalankan tugas tertentu. Delphi menggunakan struktur bahasa pemrograman
object pascal yang sudah sangat dikenal dikalangan pemrograman profesiaonal.
Gabungan dari object dan bahasa pemrograman ini sering disebut sebagai bahasa
pemrograman berorientasi object atau Object Oriented Programing (OOP).
Khusus untuk pemrograman database, Delphi menyediakan object yang
sangat kuat canggih dan lengkap, sehingga memudahkan pemrogram dalam
merancang, membuat dan menyelesaikan aplikasi database yang diinginkan.
Selain itu, Delphi juga dapat menangani data dalam berbagai format database,
misalnya format MS-Access, SyBase, Oracle, FoxPro, Informix, DB2 dan lainlain. Format database yang dianggap asli dari Delphi adalah Paradox dan dBase.
c. XAMPP
15
Menurut (Hermawan Widyo C. (Ed.), 2009: 30) Short Cours: PHP

Programming XAMPP dapat diartikan:
XAMPP adalah salah satu pake instalasi Apache, PHP, dan MySQL
secara instan yang dapat digunakan untuk membantu proses instalasi
ketiga produk tersebut sama seprti PHPTriad. Selain paket instalasi
instan, XAMPP juga memberikan fasilitas pilihan penggunaan PHP 4
atau PHP 5. Untuk melakukan migrasi ke versi lebih tinggi juga sangat
mudah dilakukan dengan bantuan PHPSwitch yang telah disertakan
oleh XAMPP. Sama halnya dengan PHP, XAMPP berisfat free atau
gratis untuk digunakan.
XAMPP adalah suatu langkah mudah untuk menginstal distribusi
Apache yang memiliki fitur program MySQL, PHP, dan Perl. XAMPP
juga sangat mudah diinstal dan digunakan. XAMPP berdasar pada lisensi
GNU General Public License, sehingga instalasi XAMPP tidak
memerlukan perubahan pada register Windows dan tidak perlu mengedit
file konfigurasinya.
Dalam paket XAMPP, akan diperoleh beberapa fitur sebagai berikut:
1) Apache
2) Cgi-Bin
3) PHP
4) MySQL
5) FTP
6) Mercury Mail (SMTP)
7) PHP MyAdmin
8) Perl
9) Webalizer
10) dll.
5. Conceptual Data Model (CDM)

Menurut (Shalahuddin, 2013: 43) CDM dimaknai sebagai berikut :
Conceptual Data Model (CDM) adalah konsep yang berkaitan dengan
pandangan pemakai terhadap data yang disimpan dalam basis data, CDM
sudah dibuat dalam bentuk tabel tabel namun belum menggambarkan
fisik dari database secara sesungguhnya. CDM merupakan hasil
penjabaran lebih lanjut dari ERD ada aturan aturan khusus dalam
menjabarkan ERD menjadi sebuah CDM yang harus di perhatikan.
6. Physical Data Model (PDM)

Menurut (Shalahuddin, 2013: 45) PDM dimaknai sebagai berikut:
Physical Data Model (PDM) adalah model yang menggunakan sejumlah
tabel untuk menggambarkan data serta hubungan antara data. Setiap tabel
mempunyai sejumlah kolom dimana setiap kolom memiliki nama yang unik
16
beserta tipe datanya. PDM merupakan konsep konsep yang menerangkan

detail dari bagaimana data disimpan dalam basis data. PDM merupakan
bentuk fisik perancangan basis data yang sudah siap di implementasikan ke
dalam DBMS sehingga nama tabel juga sudah merupakan nama asli tabel
yang akan di implementasikan ke dalam DBMS
B. Penelitian Sebelumnya
1. Penerapan Data Mining Algoritma Asosiasi Untuk Meningkatkan Penjualan (Emha,
2009)
Pada penelitiannya, (Emha, 2009) menggunakan algoritma asosiasi untuk menyusun
sebuah sistem yang memiliki kemampuan melihat pola penjualan barang untuk
meningkatkan hasil penjualan. Hasil penelitian ini penggunaan data mining dalam
menggali data terbukti dapat bermanfaat dalam dunia bisnis secara khusus terbukti
untuk kasus penjualan barang.
2. Implementasi Algoritma Apriori Pada Sistem Persediaan Obat (Studi Kasus : Apotik
Rumah Sakit Estomihi Medan) (Buulolo, 2013)
Pada penelitiannya, (Buulolo, 2013) membentuk pola kombinasi item sets dari data
penjualan (data obat keluar) dengan menggunakan algoritma apriori untuk
menghasilkan rules dengan association rules dari pola kombinasi itemsets yang
interesting. Hasil penelitian ini menunjukkan bahwa dengan algoritma apriori dan
pengujian dengan aplikasi Tanagra menghasilkan pola kombinasi itemsets dan rules
sebagai ilmu pengetahuan dan informasi penting dari data penjualan (data obat
keluar). Teknik data mining dengan algoritma apriori dapat diimplementasikan pada
sistem persediaan dengan data yang digunakan adalah data penjualan (data obat
keluar).

Bab Ii

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab Ii

Diunggah oleh

Hak Cipta:

Format Tersedia

8

Secara sederhana data mining adalah penambangan atau penemuan

Para peneliti biasanya mencoba menemukan cara untuk mendeskripsikan

Support (A) = Jumlah Transaksi Mengandung A

Gambar 2.1 : FlowChart Algoritma Apriori (Buulolo, 2013: 75)

4. Perangkat Lunak Pendukung

Delphi merupakan paket bahasa pemrograman yang bekerja dalam

adalah menyediakan komponen-

komponen dan bahasa pemrograman yang andal, sehingga memungkinkan untuk

menyediakan fasilitas pemrograman yang sangat lengkap. Fasilitas

Menurut (Hermawan Widyo C. (Ed.), 2009: 30) Short Cours: PHP

5. Conceptual Data Model (CDM)

6. Physical Data Model (PDM)

beserta tipe datanya. PDM merupakan konsep konsep yang menerangkan

Anda mungkin juga menyukai