LANDASAN TEORI
2.1 Tinjauan Studi
Terdapat cukup banyak penelitian terkait yang relevan dengan penelitian ini
telah dibuat dengan berbagai perbandingan dan berbagai algoritma yang
menguatkan penggunaan Association Rule dengan didukung oleh Algoritma
Apriori. Berikut penelitian - penelitian yang berhubungan dengan penggunaan
Association Rule dengan didukung oleh Algoritma Apriori ditunjukkan dalam tabel
2.1.
Tabel 2.1 State Of The Art
Data mining adalah analisa terhadap data untuk menemukan hubungan yang
jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terkini
dipahami dan berguna bagi pemilik data tersebut [1]. Secara garis besar, data mining
dapat dikelompokkan menjadi 2 kategori utama, yaitu:
1. Descriptive mining yaitu proses untuk menemukan karakteristik penting
dari data dalam satu basis data. Teknik data mining yang termasuk
descriptive mining adalah clustering, association dan sequential mining.
2. Predictive, yaitu proses untuk menemukan pola dari data dengan
menggunakan beberapa variable lain di masa depan. Salah satu teknik
yang terdapat dalam predictive mining adalah klasifikasi.
Secara sederhana data mining biasa dikatakan sebagai proses penyaring atau
“menambang” pengtahuan dari sejumlah data yang besar. Istilah lain untuk data
mining adalah Knowlegde Discoveryin Database (KDD). Walaupun data mining
sendiri adalah bagian dari tahapan proses KDD [2].
Tujuan dari data mining:
1. Explonatory, yaitu untuk menjelaskan beberapa kegiatan observasi
atau kondisi.
2. Confirmatory, yaitu untuk mengkonfirmasi suatu hipotesis yang telah
ada.
3. Exploratory, yaitu untuk menganalisis data baru suatu relasi yang
janggal.
Data mining memiliki kemampuan cepat dalam melakukan analisa dan sangat
fokus pada variabel-variabel. Pola dan aturan yang dapat digunakan dalam membuat
keputusan dan meramaikan dampak dari keputusan tersebut. Terdapat beberapa
metode yang digunakan dalam mengidentifikasi sebuah data yang ada di dalam
database sehingga menghasilkan informasi yang sangat berharga [2][3].
Di dalam data mining terdapat beberapa jenis atau metode yang dapat
dilakukan, yang dapat dibedakan sebagai berikut :
A. Market Basket Analysis
Market basket analysis adalah proses untuk menganalisis kebiasaan
pelanggan dalam menyampaikan item – item yang akan dibeli ke dalam
keranjang belanjanya. Market basket analysis memanfaatkan data
transaksi penjualan untuk dianalisa sehingga dapat ditemukan pola
berupa item – item yang cenderung muncul bersama dalam sebuah
transaksi. Selanjutnya pola yang ditemukan dapat dimanfaatkan untuk
merancang strategi penjualan atau pemasaran yang efektif, yaitu dengan
menempatkan item – item yang sering dibeli bersamaan ke dalam
sebuah area yang berdekatan, merancang tampilan item – item
dikatalog, merancang kupon diskon (untuk diberikan kepada pelanggan
yang membeli item tertentu), merancang penjualan item – item dalam
bentuk paket, dan sebagainya. Dengan menggunakan teknologi data
mining, analisis data secara manual tidak diperlukan lagi.
B. Cluster Detection
Ada dua pendekatan clustering, pendekatan pertama adalah dengan
mengasumsikan bahwa sejumlah cluster sudah tersimpan dalam data,
tujuannya adalah untuk memecahkan data ke dalam cluster. Pendekatan
lain, disebut clustering agglomerative, dengan asumsi keberadaan setiap
jumlah yang telah ditetapkan cluster tertentu, setiap item keluar di
cluster sendiri, dan proses terjadi berulang-ulang yang berupaya untuk
menggabungkan cluster, meskipun proses komputasi sama.
C. Memory-Based Reasoning
Metode klasifikasi yang digabungkan dengan penalaran berbasis
memori. Proses menggunakan satuset data untuk membuat model dari
prediksi atau asumsi-asumsi yang dapat dibuat tentang obyek baru yang
diperkenalkan. Ada dua komponen dasar untuk metode Memory-Based
Reasoning, yang pertama adalah kesamaan fungsi, yang mengukur
bagaimana anggota sama dari setiap pasangan objek satu sama lain.
Yang kedua yaitu fungsi kombinasi, yang digunakan untuk
menggabungkan hasil dari himpunan tetangga untuk sampai pada
keputusan.
D. Rule Induction
Ekstraksi aturan sebab akibat dari data secara statistik, identifikasi
aturan bisnis tersimpan di dalam data. Metode berhubungan dengan
induksi aturan yang digunakan untuk proses penemuan. Salah satu
pendekatan untuk penemuan aturan adalah menggunakan pohon
keputusan.
E. Neural Networks
Model prediksi non lincar yang melakukan pembelajaran melalui latihan
dan meyerupai struktur jaringan neural yang terdapat pada makhluk
hidup. Mampu menurunkan pengertian dari daya yang kompleks dan
tidak jelas dan dapat digunakan pula untuk mengekstrak pola dan
mendeteksi tren-tren yang sangat kompleks untuk dibicarakan baik oleh
manusia maupun oleh sistem computer.
F. Link analysis
Proses mencari dan membangun hubungan antara objek dalam
kumpulan data juga mencirikan sifat yang terkait dengan hubungan
antara dua objek. Link analysis berguna untuk menambil kesimpulan.
Selain itu link analysis berguna untuk proses optimasi.
Di dalam data mining terdapat beberapa teknik yang dapat dilakukan, yang
dapat digolongkan sebagai berikut:
1. Aturan Asosiasi (Association Rules)
Association rules (aturan asosiasi) atau affinity analysis (analisis afinita)
berkenaan dengan studi tentang “apa bersama apa”. Aturan asosiasi juga sering
dinamakan market basket analysis (analisis keranjang belanja). Aturam
Asosiasi ingin memberikan informasi dalam bentuk hubungan “if-then” atau
“jika-maka”. Aturan ini dihitung dari data yang sifatnya probabilistik.
Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang
menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu
tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent
pattern mining) menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien. Penting tidaknya suatu aturan assosiatif dapat diketahui
dengan dua parameter support (nilai penunjang) yaitu prosentase kombinasi
item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya
hubungan antar item dalam aturan assosiatif. Analisis asosiasi didefinisikan
suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat
minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence) [5].
2. Pengelompokan Clustering
Clustering termasuk metode yang sudah cukup dikenal dan banyak dipakai
dalam data mining. Sampai sekarang para ilmuwan dalam bidang data mining
masih melakukan berbagai usaha untuk melakukan perbaikan model clustering
karena metode yang dikembangkan sekarang masih bersifat heuristic. Usaha-
usaha untuk menghitung jumlah cluster yang optimal dan pengklasteran yang
paling baik masih terus dilakukan. Dengan demikian menggunakan metode
yang sekarang, tidak bisa menjamin hasil pengklasteran sudah merupakan hasil
yang optimal. Namun, hasil yang dicapai biasanya sudah cukup bagus dari segi
praktis.
Tujuan utama dari metode clustering adalah pengelompokan sejumlah
data/objek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi
data yang semirip mungkin. Dalam clustering metode ini berusaha untuk
menempatkan obyek yang mirip (jaraknya dekat) dalam satu klaster dan
membuat jarak antar klaster sejauh mungkin. Ini berarti obyek dalam satu
klaster sangat mirip satu sama lain dan berbeda dengan obyek dalam cluster-
cluster yang lain. Dalam metode ini tidak diketahui sebelumnya barapa jumlah
cluster dan bagaimana pengelompokkannya.
3. Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari
data untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.
Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menentukan
keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sdikit
didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan
sering memberikan kemungkinan penjelasan untuk suatu pola atau
kecenderungan.
4. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variable target estimasi
lebih kearah numerik dari pada kearah kategori. Model dibangun menggunakan
record lengkap yang menyediakan nilai dari variable target prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variable target
dibuat berdasarkan nilai variable prediksi. Sebagai contoh akan dilakukan
estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur
pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan
antara tekanan darah sistolik dan nilai variable prediksi dalam proses
pembelajaran akan menghasilkan model estimasi. Model estimasi yang
dihasilkan dapat digunakan untuk kasus baru lainnya.
5. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada dimasa mendatang. Sebagai contoh prediksi
harga beras dalam tiga bulan yang akan datang, serta contoh lain seperti contoh
prediksi presentasi kenaikan kecelakaan lalu lintas lima tahun depan jika batas
bawah kecepatan dinaikkan. Beberapa metode dan teknik yang digunakan
dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat)
untuk prediksi.
6. Klasifikasi
Dalam klasifikasi, terdapat target variable kategori. Sebagai contoh
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan
tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam
bisnis dan penelitian adalah:
1. Menentukan apakah suatu transaksi kartu kredit merupakan
transaksi yang curang atau tidak.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah
merupakan suatu kredit yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan
termasuk kategori penyakit apa [7].
Support ( A → B ) = P ( A ∩B ) (1)
Confidence ( A → B ) = P ( B | A ) (2)
Jika support itemset dari itemset 𝐼 memenuhi minimum support threshold yang
sudah ditentukan maka 𝐼 adalah frequent 𝑘-itemset. Secara umum frequent 𝑘-
itemset dilambangkan dengan 𝐿𝑘. Berdasarkan Persamaan (2) diperoleh :
Support ( A ∪ B)
Confidence ( A → B ) = P ( B | A ) = (3)
Support ( A )
Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Aturan
yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis
atau market basket analysis. Analisis asosiasi atau association rule mining adalah
teknik data mining untuk menentukan aturan suatu kombinasi item. Salah satu tahap
analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien adalah analisis pola frekuensi tinggi (frequent pattern
mining), penting tidaknya suatu asosiasi dapat diketahui dengan dua tolak ukur,
yaitu: support dan confidence. Support (nilai penunjang) adalah presentase
kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian)
adalah kuatnya hubungan antar item dalam aturan asosiasi [5].
Tahap awal dalam algoritma apriori ialah analisis pola pada frekuensi tinggi
yaitu dengan mencari kombinasi item yang memenuhi syarat minimum dengan nilai
support dalam basis data. Nilai support sebuah item diperoleh dengan rumus
berikut:
jumlah transaksi mengandung A
Support (A) = x 100%
total transaksi
Sementara, nilai support dari 2 item diperoleh dengan rumus berikut:
∑ transaksimengandung A dan B
Support (A ∩B) = x 100%
∑transaksi
2.5 Pembelian
Latar Belakang
Pendapatan yang turun karena terlalu banyak barang yang tidak terjual. Untuk
meningkatkan pendapatan. Untuk mengetahui barang yang sering dibeli dan barang
yang kemungkinan besar terkait juga dibeli pelanggan. Adapun permasalahan lain yang
ada pada Toko Alat Tulis Sumurboto Stationery yaitu sering tidak adanya barang
yang ingin dibeli pelanggan.
Masalah
Tujuan
Eksperimen
Dalam penelitian ini dapat menentukan barang yang sering dibeli dan penawaran
barang kepada pelanggan yang kemungkinan besar dapat dibeli.