LANDASAN TEORI
Sebagai bidang ilmu yang relative baru, saat ini Data Mining menjadi salah satu
pusat perhatian para akademis maupun praktisi. Menurut (Suntoro, 2019) data mining
adalah proses untuk mendapatkan informasi yang berguna dari basis data yang besar dan
perlu diekstraksi agar menjadi informasi baru dan dapat membantu dalam pengambilan
keputusan. Data mining adalah proses menganalisa data dari yang berbeda dan
menyimpulkannya menjadi informasi atau pengetahuan atau pola yang penting untuk
(Witten, 2016).
A. Tipe Data Numerik adalah tipe data yang diperoleh dengan cara pengukuran,
B. Tipe Data Kategorial adalah tipe data yang diperoleh dengan cara kategorisasi
atau klasifikasi.
6
7
C. Tipe Data Rentang Waktu adalah tipe yang diperoleh dengan cara menunjukan
Menurut Tan 2004 dalam (Vulandari S. , 2017) Pemanfaatan dari data mining
sendiri bisa dilihat dari dua sudut pandang, baik sudut pandang komersial dan sudut
pandang keilmuan. Dari sudut pandang komersial, data mining bisa digunakan untuk
Selain itu data mining juga bisa dimanfaatkan untuk menyelesaikan masalah dalam
5. Menilai tingkat resiko dalam menentukan jumlah produksi pada suatu item.
Menurut Tan 2004 dalam (Vulandari S. M., Data mining teori dan aplikasi
rapidminer, 2017), serangkaian proses tahapan memiliki tujuh (7) tahapan yaitu :
dengan hipotesa yang telah dibuat. Sehingga pada proses selanjutnya dapat
database kedalam satu database baru. Tidak sedikit data yang dibutuhkan
Data yang sudah ada di database seringkali tidak semuanya dibutuhkan, maka
dari itu dibutuhkan penyeleksian data untuk data yang benar-benar dibutuhkan
Data digabung atau diubah sesuai dengan proses yang digunakan dalam data
mining. Karena beberapa format data mining membutuhkan format data yang
E. Proses mining
Adalah proses menggali data dari sebuah database atau kumpulan data untuk
Dalam proses ini adalah hasil dari teknik data mining berupa pola-pola yang akan
diujia pada hipotesa yang sudah dibuat sebelumnya. Sehingga akan memperoleh
selanjutnya.
Ini termasuk dalam langkah akhir dari data mining dalam tahap ini saatnya untuk
B. Sequence, adalah proses untuk menetukan aturan asosiasi Antara suatu kombinasi
item dalam suatu waktu dan diterapkan lebih dari satu periode.
D. Classificasion, adalah proses penemuan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan
G. Solution, adalah proses penemuan akar masalaj dan problem solving dari
persoalan bisnis yang diharapkan atau paling tidak sebagai informasi dalam
pengabilan keputusan.
estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.
3. Prediksi: hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada di masa mendatang. Beberapa metode dan
teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan
Klaster adalah kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan record dalam klaster yang lain. Berbeda
6. Asosiasi: Tugas asosiasi dalam data mining adalah untuk menemukan atribut
yang muncul dalam satu waktu. Salah satu implementasi dari asosiasi adalah
market basket analysis sebagaimana yang akan dibahas dalam penelitian ini.
12
Menurut (Agusta, 2015) Association Rule adalah suatu metode data mining yang
bertujuan untuk mencari sekumpulan items yang sering muncul bersamaan. Umumnya
association rule ini dianalogikan dengan keranjang belanjaan. Dari keranjang belanjaan
para pengunjung supermarket akan dapat diketahui, barang apa saja yang sering dibeli
Menurut (Pracoyo, 2016) Analisis asosiasi atau association rule mining adalah
teknik data mining untuk menemukan aturan suatu kombinasi item. Salah satu tahap
analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma
yang efisien adalah analisis pola frenkuensi tinggi (frequent pattern mining). penting
tidaknya suatu asosiasi dapat diketahui dengan dua tolak ukur, yaitu : support dan
confidence. Support (nilai penunjang) adalah persentase kombinasi item tersebut dalam
database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar item
Menurut (Mazida, 2015) Algoritma Apriori termasuk jenis aturan asosiasi pada
data mining. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut
affinity analysis atau market basket analysis. misalnya sebuah swalayan memiliki
market basket, dengan adanya algoritma apriori, pemilik swalayan dapat mengetahui
pola pembelian seorang konsumen, jika seorang konsumen membeli item A , B, punya
13
kemungkinan 50% dia akan membeli item C, pola ini sangat signifikan dengan adanya
Menurut (Pracoyo, 2016) Apriori adalah suatu algoritma yang sudah sangat
dikenal dalam melakukan pencarian frequent item set dengan menggunakan teknik
2.1.8. Tanagra
Menurut (Badrul, 2016) Tanagra adalah software Data Mining bebas untuk tujuan
akademik dan penelitian ini mengusulkan beberapa metode data mining dari analisis
adalah "proyek open source" karena setiap peneliti dapat mengakses ke kode sumber,
dan menambahkan algoritma sendiri, sejauh dia setuju dan sesuai dengan lisensi
distribusi perangkat lunak. Tujuan utama dari proyek Tanagra adalah memberikan
peneliti dan mahasiswa yang mudah untuk menggunakan perangkat lunak data mining,
sesuai dengan norma-norma yang hadir dari pengembangan perangkat lunak dalam
domain ini (terutama dalam desain GUI dan cara untuk menggunakannya), dan
Penulis telah melakukan beberapa kajian terhadap penelitian yang telah dibuat
Menurut (Santoso, 2017) Teknik algoritma apriori untuk mencari informasi pola
buku sesuai dengan tingkat support dan confidence yang dimiliki oleh masing-masing
buku yang saling berkaitan. Selain untuk memberikan rekomendasi penyusunan buku,
juga dapat dijadikan sebagai refrensi untuk pengadaan buku baru sesuai topik buku-buku
yang sering dipinjam oleh pengunjung perpustakaan. Berdasarkan hasil penelitian dapat
informasi berupa pola hubungan keterkaitan antar buku-buku yang sering dipinjam. Dan
hasil aplikasi adalah rekomendasi penyusunan tata letak buku sesuai dengan pola
dimiliki.
buku yang telah tersedia pada rak buku namun belum diatur berdasarkan intensitasi
peminjaman buku yang dilakukan oleh anggota sehingga masih banyak buku-buku lama
yang masih tersedia di perpustakaan sehingga digunakan teknik asosiasi data mining,
perangkat lunak pengujian XLminer dihasilkan kecocokan hasil yang diperoleh yaitu
confidence 100% Kimia dan Fisika, Biologi dan Fisika, Sosiologi dan Fisika.
Menurut (Esis Srikanti, 2018) Selama ini, data transaksi peminjaman buku di
Perpustakaan Fakultas Sains dan Teknologi hanya disimpan begitu saja tanpa ada
pengolahan lebih lanjut. Padahal banyaknya jumlah data transaksi peminjaman tersebut
bisa digunakan untuk mengetahui aturan asosiasi antara dua buku atau lebih. Sehingga
digunakan teknik asosiasi data mining, kemudian menghasilkan nilai confidence sebesar
81%. Selain itu, juga menunjukkan bahwa jika mahasiswa meminjaman buku dengan
kategori sistem pakar maka juga akan meminjam buku dengan kategori pemrograman.
Setelah dilihat dari beberapa sumber dalam penelitian terkait, maka akan melakukan
melihat nilai minimum support dan nilai minimum confidence, yang hasilnya akan
digunakan untuk rekomendasi penempatan buku di kelurahan cisarua. Hal ini akan
Visi :
Misi :
Lokasi :
PEMBINA
Lurah Cisarua
Kepala Perpustakaan