Bab Ii

BAB II
LANDASAN TEORI
2.1. Tinjauan Pustaka
2.1.1. Pengertian Data Mining
Sebagai bidang ilmu yang relative baru, saat ini Data Mining menjadi salah satu
pusat perhatian para akademis maupun praktisi. Menurut (Suntoro, 2019) data mining
adalah proses untuk mendapatkan informasi yang berguna dari basis data yang besar dan
perlu diekstraksi agar menjadi informasi baru dan dapat membantu dalam pengambilan
keputusan. Data mining adalah proses menganalisa data dari yang berbeda dan
menyimpulkannya menjadi informasi atau pengetahuan atau pola yang penting untuk
meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan keduanya
(Witten, 2016).
2.1.2. Tipe Data Mining :
A. Tipe Data Numerik adalah tipe data yang diperoleh dengan cara pengukuran,
dimana jarak dua titik pada skala sudah diketahui.
B. Tipe Data Kategorial adalah tipe data yang diperoleh dengan cara kategorisasi
atau klasifikasi.
6
7
C. Tipe Data Rentang Waktu adalah tipe yang diperoleh dengan cara menunjukan
beberapa objek yang berbeda.
2.1.3. Manfaat Data Mining
Menurut Tan 2004 dalam (Vulandari S. , 2017) Pemanfaatan dari data mining
sendiri bisa dilihat dari dua sudut pandang, baik sudut pandang komersial dan sudut
pandang keilmuan. Dari sudut pandang komersial, data mining bisa digunakan untuk
menangani adanya peledakan dari volume data. Dengan melihat bagaimana
menyimpannnya, mengekstraknya dan memanfaatkannya. Tentunya berbagai ilmu
komputasi dapat untuk menghasilkan informasi yang dibutuhkan.
Selain itu data mining juga bisa dimanfaatkan untuk menyelesaikan masalah dalam
kebutuhan dibidang bisnis, misalnya :
1. Mengetahui hilangnya pelanggan dikarenakan adanya pesaing.
2. Mengetahui item suatu produk yang memiliki kesamaan karakteristik.
3. Mengidentifikasi produk-produk yang sudah terjual dengan produk lainnya.
4. Untuk memprediksi dari tingkat penjualan.
5. Menilai tingkat resiko dalam menentukan jumlah produksi pada suatu item.
6. Memprediksi perilaku bisnis dimasa depan.

8
2.1.4. Tahap-Tahap Data Mining
Menurut Tan 2004 dalam (Vulandari S. M., Data mining teori dan aplikasi
rapidminer, 2017), serangkaian proses tahapan memiliki tujuh (7) tahapan yaitu :
A. Pembersihan Data (data cleaning)
Pembersihan data adalah proses untuk menghilangkan data-data yang tidak
relevan. Data-data yang dibuang terkadang dibandingkan terlebih dahulu
dengan hipotesa yang telah dibuat. Sehingga pada proses selanjutnya dapat
dengan mudah menemukan hasil yang diinginkan.
B. Integrasi data (data integration)
Integrasi data merupakan proses dalam menggabungkan data dari berberapa
database kedalam satu database baru. Tidak sedikit data yang dibutuhkan
diambil dari berbagai database atau teks file.
C. Seleksi data (data selection)
Data yang sudah ada di database seringkali tidak semuanya dibutuhkan, maka
dari itu dibutuhkan penyeleksian data untuk data yang benar-benar dibutuhkan
dalam proses selanjutnya.
D. Transformasi data (data trasnformation)
Data digabung atau diubah sesuai dengan proses yang digunakan dalam data
mining. Karena beberapa format data mining membutuhkan format data yang
khusus dalam pemrosesannya.

9
E. Proses mining
Adalah proses menggali data dari sebuah database atau kumpulan data untuk
memperoleh informasi yang tersembunyi dari data yang diolah
F. Evaluasi Pola (pattern evaluation)
Dalam proses ini adalah hasil dari teknik data mining berupa pola-pola yang akan
diujia pada hipotesa yang sudah dibuat sebelumnya. Sehingga akan memperoleh
kesimpulan-kesimpulan yang mendekati hasil atau hipotesa untuk proses
selanjutnya.
G. Presentasi pengetahuan (knowlegde presentation)
Ini termasuk dalam langkah akhir dari data mining dalam tahap ini saatnya untuk
mempresentasikan hasil yang telah di lakukan dengan mengimplementasikan
analisis yang didapat. Sehingga akan memperoleh kesimpulan real.
2.1.5. Fungsi Data Mining
Menurut (Hasket, 2017) Fungsi umum dalam data mining yaitu :
A. Assosiation, adalah proses untuk menemukan aturan asosiasi Antara suatu
kombinasi item dalam suatu waktu.
B. Sequence, adalah proses untuk menetukan aturan asosiasi Antara suatu kombinasi
item dalam suatu waktu dan diterapkan lebih dari satu periode.
C. Clustering, adalah proses pengelompokan sejumlah data/objek ke dalam kelompok
data sehingga setiap kelompok berisi data yang mirip.

10
D. Classificasion, adalah proses penemuan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk dapat memperkirakan
kelas dari suatu objek yang labelnya tidak diketahui.
E. Regression, adalah proses pemetaan data dalam suatu nilai prediksi.
F. Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di
dalam sekumpulan data.
G. Solution, adalah proses penemuan akar masalaj dan problem solving dari
persoalan bisnis yang diharapkan atau paling tidak sebagai informasi dalam
pengabilan keputusan.
2.1.6. Tugas/Pekerjaan dalam data mining
Menurut (Rerung, 2018) Data mining dibagi menjadi beberapa kelompok
berdasarkan tugas/pekerjaan yang dapat dilakukan yaitu :
1. Deskripsi: terkadang peneliti dan analisis secara sederhana ingin mencoba
mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat
dalam data. Deskripsi dari pola kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Estimasi: hampir sama dengan klasifikasi, kecuali variabel target estimasi
lebih ke arah numerik dari pada ke arah kategori. Model dibangun
menggunakan baris data (record) lengkap yang menyediakan nilai dari

11
variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya
estimasi nilai dari variabel target dibuat berdasarkan nilai variabel prediksi.
3. Prediksi: hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada di masa mendatang. Beberapa metode dan
teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan
(untuk keadaan yang tepat) untuk prediksi.
4. Klasifikasi: terdapat target variabel kategori. Sebagai contoh, penggolongan
pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
5. Pengklasteran: merupakan pengelompokan record, pengamatan, atau
memperhatikan dan membentuk kelas obyek-obyek yang memiliki kemiripan.
Klaster adalah kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan record dalam klaster yang lain. Berbeda
dengan klasifikasi, pada pengklasteran tidak ada variabel target. Pengklasteran
tidak melakukan klasifikasi, mengestimasi, atau memprediksi nilai dari
variabel target, akan tetapi, algoritma pengklasteran mencoba untuk
melakukan pembagian terhadap keseluruhan data menjadi kelompok-
kelompok yang memiliki kemiripan (homogen), yang mana kemiripan record
dalam satu kelompok akan bernilai maksimal, sedangkan kemiripan dengan
record dalam kelompok lain akan bernilai minimal.
6. Asosiasi: Tugas asosiasi dalam data mining adalah untuk menemukan atribut
yang muncul dalam satu waktu. Salah satu implementasi dari asosiasi adalah
market basket analysis sebagaimana yang akan dibahas dalam penelitian ini.
12
2.1.6. Association Rules
Menurut (Agusta, 2015) Association Rule adalah suatu metode data mining yang
bertujuan untuk mencari sekumpulan items yang sering muncul bersamaan. Umumnya
association rule ini dianalogikan dengan keranjang belanjaan. Dari keranjang belanjaan
para pengunjung supermarket akan dapat diketahui, barang apa saja yang sering dibeli
bersamaan dan barang mana saja yang tidak.
Menurut (Pracoyo, 2016) Analisis asosiasi atau association rule mining adalah
teknik data mining untuk menemukan aturan suatu kombinasi item. Salah satu tahap
analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma
yang efisien adalah analisis pola frenkuensi tinggi (frequent pattern mining). penting
tidaknya suatu asosiasi dapat diketahui dengan dua tolak ukur, yaitu : support dan
confidence. Support (nilai penunjang) adalah persentase kombinasi item tersebut dalam
database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antar item
dalam aturan asosiasi.
2.1.7. Algoritma Apriori
Menurut (Mazida, 2015) Algoritma Apriori termasuk jenis aturan asosiasi pada
data mining. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut
affinity analysis atau market basket analysis. misalnya sebuah swalayan memiliki
market basket, dengan adanya algoritma apriori, pemilik swalayan dapat mengetahui
pola pembelian seorang konsumen, jika seorang konsumen membeli item A , B, punya
13
kemungkinan 50% dia akan membeli item C, pola ini sangat signifikan dengan adanya
data transaksi selama ini.
Menurut (Pracoyo, 2016) Apriori adalah suatu algoritma yang sudah sangat
dikenal dalam melakukan pencarian frequent item set dengan menggunakan teknik
association rule. Algoritma apriori menggunakan knowledge mengenai frequent itemset
yang sebelumnya telah diketahui, untuk memproses informasi selanjutnya. Pada
algoritma apriori untuk menentukan kandidatkandidat yang mungkin muncul yakni
dengan cara memperhatikan minimum support.
2.1.8. Tanagra
Menurut (Badrul, 2016) Tanagra adalah software Data Mining bebas untuk tujuan
akademik dan penelitian ini mengusulkan beberapa metode data mining dari analisis
eksplorasi data, pembelajaran statistik, pembelajaran mesin dan daerah database.Tanagra
adalah "proyek open source" karena setiap peneliti dapat mengakses ke kode sumber,
dan menambahkan algoritma sendiri, sejauh dia setuju dan sesuai dengan lisensi
distribusi perangkat lunak. Tujuan utama dari proyek Tanagra adalah memberikan
peneliti dan mahasiswa yang mudah untuk menggunakan perangkat lunak data mining,
sesuai dengan norma-norma yang hadir dari pengembangan perangkat lunak dalam
domain ini (terutama dalam desain GUI dan cara untuk menggunakannya), dan
memungkinkan untuk menganalisis baik data yang nyata atau sintetis.

14
2.2. Penelitian Terkait
Penulis telah melakukan beberapa kajian terhadap penelitian yang telah dibuat
sebelumnya dalam bentuk skripsi, diantaranya :
Menurut (Santoso, 2017) Teknik algoritma apriori untuk mencari informasi pola
hubungan keterkaitan antar buku-buku yang sering dipinjam oleh pengunjung
perpustakaan secara bersamaan. Sehingga dapat memberikan rekomendasi penyusunan
buku sesuai dengan tingkat support dan confidence yang dimiliki oleh masing-masing
buku yang saling berkaitan. Selain untuk memberikan rekomendasi penyusunan buku,
juga dapat dijadikan sebagai refrensi untuk pengadaan buku baru sesuai topik buku-buku
yang sering dipinjam oleh pengunjung perpustakaan. Berdasarkan hasil penelitian dapat
disimpulkan bahwa data mining menggunakan algoritma apriori dapat memberikan
informasi berupa pola hubungan keterkaitan antar buku-buku yang sering dipinjam. Dan
hasil aplikasi adalah rekomendasi penyusunan tata letak buku sesuai dengan pola
keterkaitan antar masing-masing buku berdasarkan support dan confidence yang
dimiliki.
Menurut (Robi Yanto, 2017) penempatan buku dilakukan berdasarkan kategori
buku yang telah tersedia pada rak buku namun belum diatur berdasarkan intensitasi
peminjaman buku yang dilakukan oleh anggota sehingga masih banyak buku-buku lama
yang masih tersedia di perpustakaan sehingga digunakan teknik asosiasi data mining,
kemudian menghasilkan dari proses 10 data transaksi peminjaman buku dengan
minimum support 5 dan minimum confidence 83.3 % yang dilakukan menggunakan

15
perangkat lunak pengujian XLminer dihasilkan kecocokan hasil yang diperoleh yaitu
confidence 100% Kimia dan Fisika, Biologi dan Fisika, Sosiologi dan Fisika.
Menurut (Esis Srikanti, 2018) Selama ini, data transaksi peminjaman buku di
Perpustakaan Fakultas Sains dan Teknologi hanya disimpan begitu saja tanpa ada
pengolahan lebih lanjut. Padahal banyaknya jumlah data transaksi peminjaman tersebut
bisa digunakan untuk mengetahui aturan asosiasi antara dua buku atau lebih. Sehingga
digunakan teknik asosiasi data mining, kemudian menghasilkan nilai confidence sebesar
81%. Selain itu, juga menunjukkan bahwa jika mahasiswa meminjaman buku dengan
kategori sistem pakar maka juga akan meminjam buku dengan kategori pemrograman.
Aturan ini memiliki nilai confidence sebesar 77%.
Setelah dilihat dari beberapa sumber dalam penelitian terkait, maka akan melakukan
penelitian menggunakan algoritma apriori dan perangkat lunak pengujiannya adalah
rapidminer sebagai acuannya. Dengan menggunakan algoritma tersebut peneliti dapat
melihat nilai minimum support dan nilai minimum confidence, yang hasilnya akan
digunakan untuk rekomendasi penempatan buku di kelurahan cisarua. Hal ini akan
mempermudah petugas dalam penempatan buku ataupun anggota perpustakaan dalam
mencari uku yang ingin dipinjamnya.
2.3. Tinjauan Organisasi/Objek Penelitian
2.3.1. Sejarah Perpustakaan Kelurahan Cisarua

16
Perpustakaan Kelurahaan Cisarua Berawal dari pojok baca kelurahan, Ketika
gedung kelurahan pindah disanalah awal berdirinya perpustakaan cisarua seiring
berjalannya waktu perpustakaan terus berkembang sampai sekarang. Perpustakaan
Kelurahaan Cisarua banyak mendapatkan buku-buku dan banyaknya peminjam
buku guna mencari dan mendapatkan informasi-informasi yang ingin dicari.
2.3.2. Visi dan Misi Perpustakaan Kelurahan Cisarua
Visi :
“Menjadikan Perpustakaan Cisarua ( PERCIS ) Sebagai Pusat Literasi Untuk
Memujudkan Masyarakat SocialPreneur “
Misi :
“Aktif meningkatkan literasi bagi masyarakat melalui berbagai kegiatan pemberdayaan
untuk mencapai kesejahteraan”
2.3.3. Profil perpustakaan kelurahaan cisarua
Lokasi :
Tempat : Jalan samsi no.45 Rt/Rw 02/16
Letak : Gedung tersendiri
Ukuran : Luas 180 m2
Sifat : Ruang Khusus perpustakaan

17
2.3.4. Struktur Organisasi Perpustakaan Kelurahan Cisarua
PEMBINA
Lurah Cisarua
Kepala Perpustakaan
Entang Darmadi, S.IP.
Unit Layanan Pembaca Unit Layanan TI

Yusmeli
Sri Mulyani Elfin Permana, S.Pd.
Sumber : Pembina” Perpustakaan Kelurahan Cisarua”
Gambar: 2.1 Struktur Organisasi “Perpustakaan Kelurahaan Cisarua”

18

Bab Ii

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab Ii

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB II

2.1. Tinjauan Pustaka

2.1.1. Pengertian Data Mining

meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan keduanya

2.1.2. Tipe Data Mining :

dimana jarak dua titik pada skala sudah diketahui.

beberapa objek yang berbeda.

2.1.3. Manfaat Data Mining

menangani adanya peledakan dari volume data. Dengan melihat bagaimana

menyimpannnya, mengekstraknya dan memanfaatkannya. Tentunya berbagai ilmu

komputasi dapat untuk menghasilkan informasi yang dibutuhkan.

kebutuhan dibidang bisnis, misalnya :

1. Mengetahui hilangnya pelanggan dikarenakan adanya pesaing.

2. Mengetahui item suatu produk yang memiliki kesamaan karakteristik.

3. Mengidentifikasi produk-produk yang sudah terjual dengan produk lainnya.

4. Untuk memprediksi dari tingkat penjualan.

6. Memprediksi perilaku bisnis dimasa depan.

2.1.4. Tahap-Tahap Data Mining

A. Pembersihan Data (data cleaning)

Pembersihan data adalah proses untuk menghilangkan data-data yang tidak

relevan. Data-data yang dibuang terkadang dibandingkan terlebih dahulu

dengan mudah menemukan hasil yang diinginkan.

B. Integrasi data (data integration)

Integrasi data merupakan proses dalam menggabungkan data dari berberapa

diambil dari berbagai database atau teks file.

C. Seleksi data (data selection)

dalam proses selanjutnya.

D. Transformasi data (data trasnformation)

khusus dalam pemrosesannya.

memperoleh informasi yang tersembunyi dari data yang diolah

F. Evaluasi Pola (pattern evaluation)

kesimpulan-kesimpulan yang mendekati hasil atau hipotesa untuk proses

G. Presentasi pengetahuan (knowlegde presentation)

mempresentasikan hasil yang telah di lakukan dengan mengimplementasikan

analisis yang didapat. Sehingga akan memperoleh kesimpulan real.

2.1.5. Fungsi Data Mining

Menurut (Hasket, 2017) Fungsi umum dalam data mining yaitu :

A. Assosiation, adalah proses untuk menemukan aturan asosiasi Antara suatu

kombinasi item dalam suatu waktu.

C. Clustering, adalah proses pengelompokan sejumlah data/objek ke dalam kelompok

data sehingga setiap kelompok berisi data yang mirip.

kelas dari suatu objek yang labelnya tidak diketahui.

E. Regression, adalah proses pemetaan data dalam suatu nilai prediksi.

F. Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di

dalam sekumpulan data.

2.1.6. Tugas/Pekerjaan dalam data mining

Menurut (Rerung, 2018) Data mining dibagi menjadi beberapa kelompok

berdasarkan tugas/pekerjaan yang dapat dilakukan yaitu :

1. Deskripsi: terkadang peneliti dan analisis secara sederhana ingin mencoba

mencari cara untuk menggambarkan pola dan kecenderungan yang terdapat

dalam data. Deskripsi dari pola kecenderungan sering memberikan

kemungkinan penjelasan untuk suatu pola atau kecenderungan.

2. Estimasi: hampir sama dengan klasifikasi, kecuali variabel target estimasi

lebih ke arah numerik dari pada ke arah kategori. Model dibangun

menggunakan baris data (record) lengkap yang menyediakan nilai dari

variabel target sebagai nilai prediksi. Selanjutnya, pada peninjauan berikutnya

(untuk keadaan yang tepat) untuk prediksi.

4. Klasifikasi: terdapat target variabel kategori. Sebagai contoh, penggolongan

pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan tinggi,

pendapatan sedang, dan pendapatan rendah.

5. Pengklasteran: merupakan pengelompokan record, pengamatan, atau

memperhatikan dan membentuk kelas obyek-obyek yang memiliki kemiripan.

dengan klasifikasi, pada pengklasteran tidak ada variabel target. Pengklasteran