Anda di halaman 1dari 15

BAB II

LANDASAN TEORI
2.1 Tinjauan Studi
Terdapat cukup banyak penelitian terkait yang relevan dengan penelitian ini
telah dibuat dengan berbagai perbandingan dan berbagai algoritma yang
menguatkan penggunaan Association Rule dengan didukung oleh Algoritma
Apriori. Berikut penelitian - penelitian yang berhubungan dengan penggunaan
Association Rule dengan didukung oleh Algoritma Apriori ditunjukkan dalam tabel
2.1.
Tabel 2.1 State Of The Art

No Judul Peneliti, Tahun Masalah Metode Hasil

1. Penggunaan Reeza Palava, Toserba ingin Algoritma Sistem tersebut


Algoritma Apriori 2015 menentukan Apriori berupa
untuk menentukan perencanaan pembentukan
rekomendasi strategi promosi paket belanja
strategi penjualan penjualan yang yang terdiri dari
pada Toserba efektif yang dapat item belanja
membantu kombinasi
meningkatkan tersebut hasil dari
kepuasan kepada perkalian data
konsumen. transaksi
penjualan dengan
menerapkan
Algoritma
Apriori. Sistem
tersebut dapat
digunakan
sebagai
perencanaan
penjualan.
2. Penerapan Data Nurdim, Dewi Supermarket Arsocration Sistem ini mampu
mining untuk Astika, 2015 tersebut Rules, Algoritma menganalisa dan
menganalisis memerlukan usaha Apriori mengolah data
penjualan barang untuk mengolah transaksi untuk
dengan data – data agar menemukan
menggunakan dapat dijadikan Frequent Itemset
metode Apriori sebagai informasi dan assocration
pada supermarket yang berguna rule yang
sejahtera memenuhi batas
Lhokseumawe transaksi.
3. Penerapan Data Desak Made Tan’s Bakery ingin Algoritma Algoritama
Mining pada Dwi, 2017 menganalisis Apriori Apriori terbukti
penjualan Tan’s transaksi penjualan dapat digunakan
Bakery selain untuk pada data
menggunakan menghemat waktu, penjualan Tan’s
Algoritma Apriori tingkat akurat Bakery dimana
informasi dan dengan teknik
menghasilkan tersebut dapat
informasi yang membantu Tan’s
berguna Bakery dalam
mengetahui
asosiasi data
tertinggi yang
terbentuk dari
analisis data
mining.

2.2 Landasan Teori

2.2.1 Data Mining

Data mining adalah analisa terhadap data untuk menemukan hubungan yang
jelas serta menyimpulkannya yang belum diketahui sebelumnya dengan cara terkini
dipahami dan berguna bagi pemilik data tersebut [1]. Secara garis besar, data mining
dapat dikelompokkan menjadi 2 kategori utama, yaitu:
1. Descriptive mining yaitu proses untuk menemukan karakteristik penting
dari data dalam satu basis data. Teknik data mining yang termasuk
descriptive mining adalah clustering, association dan sequential mining.
2. Predictive, yaitu proses untuk menemukan pola dari data dengan
menggunakan beberapa variable lain di masa depan. Salah satu teknik
yang terdapat dalam predictive mining adalah klasifikasi.
Secara sederhana data mining biasa dikatakan sebagai proses penyaring atau
“menambang” pengtahuan dari sejumlah data yang besar. Istilah lain untuk data
mining adalah Knowlegde Discoveryin Database (KDD). Walaupun data mining
sendiri adalah bagian dari tahapan proses KDD [2].
Tujuan dari data mining:
1. Explonatory, yaitu untuk menjelaskan beberapa kegiatan observasi
atau kondisi.
2. Confirmatory, yaitu untuk mengkonfirmasi suatu hipotesis yang telah
ada.
3. Exploratory, yaitu untuk menganalisis data baru suatu relasi yang
janggal.

Gambar 2.1 Knowlegde Discoveryin Database

2.2.2 Karakteristik Data Mining

Berikut adalah beberapa karakteristik data mining :


1. Data mining berhubungan dengan penemuan suatu yang tersembunyi
dan pola data tertentu yang tidak diketahui sebelumnya.
2. Biasanya data mining menggunakan data yang besar, karena dengan
data yang besar dapat menghasilkan hasil yang lebih terpercaya.

2.2.3 Fungsi Data Mining

Data mining memiliki kemampuan cepat dalam melakukan analisa dan sangat
fokus pada variabel-variabel. Pola dan aturan yang dapat digunakan dalam membuat
keputusan dan meramaikan dampak dari keputusan tersebut. Terdapat beberapa
metode yang digunakan dalam mengidentifikasi sebuah data yang ada di dalam
database sehingga menghasilkan informasi yang sangat berharga [2][3].

2.2.4 Jenis atau Metode Data Mining

Di dalam data mining terdapat beberapa jenis atau metode yang dapat
dilakukan, yang dapat dibedakan sebagai berikut :
A. Market Basket Analysis
Market basket analysis adalah proses untuk menganalisis kebiasaan
pelanggan dalam menyampaikan item – item yang akan dibeli ke dalam
keranjang belanjanya. Market basket analysis memanfaatkan data
transaksi penjualan untuk dianalisa sehingga dapat ditemukan pola
berupa item – item yang cenderung muncul bersama dalam sebuah
transaksi. Selanjutnya pola yang ditemukan dapat dimanfaatkan untuk
merancang strategi penjualan atau pemasaran yang efektif, yaitu dengan
menempatkan item – item yang sering dibeli bersamaan ke dalam
sebuah area yang berdekatan, merancang tampilan item – item
dikatalog, merancang kupon diskon (untuk diberikan kepada pelanggan
yang membeli item tertentu), merancang penjualan item – item dalam
bentuk paket, dan sebagainya. Dengan menggunakan teknologi data
mining, analisis data secara manual tidak diperlukan lagi.
B. Cluster Detection
Ada dua pendekatan clustering, pendekatan pertama adalah dengan
mengasumsikan bahwa sejumlah cluster sudah tersimpan dalam data,
tujuannya adalah untuk memecahkan data ke dalam cluster. Pendekatan
lain, disebut clustering agglomerative, dengan asumsi keberadaan setiap
jumlah yang telah ditetapkan cluster tertentu, setiap item keluar di
cluster sendiri, dan proses terjadi berulang-ulang yang berupaya untuk
menggabungkan cluster, meskipun proses komputasi sama.
C. Memory-Based Reasoning
Metode klasifikasi yang digabungkan dengan penalaran berbasis
memori. Proses menggunakan satuset data untuk membuat model dari
prediksi atau asumsi-asumsi yang dapat dibuat tentang obyek baru yang
diperkenalkan. Ada dua komponen dasar untuk metode Memory-Based
Reasoning, yang pertama adalah kesamaan fungsi, yang mengukur
bagaimana anggota sama dari setiap pasangan objek satu sama lain.
Yang kedua yaitu fungsi kombinasi, yang digunakan untuk
menggabungkan hasil dari himpunan tetangga untuk sampai pada
keputusan.
D. Rule Induction
Ekstraksi aturan sebab akibat dari data secara statistik, identifikasi
aturan bisnis tersimpan di dalam data. Metode berhubungan dengan
induksi aturan yang digunakan untuk proses penemuan. Salah satu
pendekatan untuk penemuan aturan adalah menggunakan pohon
keputusan.
E. Neural Networks
Model prediksi non lincar yang melakukan pembelajaran melalui latihan
dan meyerupai struktur jaringan neural yang terdapat pada makhluk
hidup. Mampu menurunkan pengertian dari daya yang kompleks dan
tidak jelas dan dapat digunakan pula untuk mengekstrak pola dan
mendeteksi tren-tren yang sangat kompleks untuk dibicarakan baik oleh
manusia maupun oleh sistem computer.
F. Link analysis
Proses mencari dan membangun hubungan antara objek dalam
kumpulan data juga mencirikan sifat yang terkait dengan hubungan
antara dua objek. Link analysis berguna untuk menambil kesimpulan.
Selain itu link analysis berguna untuk proses optimasi.

2.2.5 Tahap-tahap Data Mining

Sebagai serangkaian proses, data mining dapat dibagi menjadi beberapa


tahapan. Adapun tahap-tahap dalam proses data mining tersebut sebagai berikut:
1. Pembersihan Data ( Data Cleaning )
Pembersihan data merupakan proses menghilangkan noise dari data
yang tidak konsisten atau data tidak relevan. Pada umumnya data yang
diperoleh baik dari database suati perusahaan maupun hasil eksperimen,
memiliki isian-isian yang tidak sempurna seperti data yang hilang, data
yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga
atribut-atribut data yang tidak relevam dengan hipotesa data mining
yang dimiliki. Data-data yang tidak relevan itu juga lebih baik dibuang.
Pembersihan data juga akan mempengaruhi performasi dari teknik data
mining karena data yang ditangani akan berkurang jumlah dan
kompleksitasnya.
2. Integrasi Data ( Data Integration )
Integrasi data merupakan penggabungan dari berbagai database ke
dalam satu database baru. Tidak jarang data yang diperlukan untuk data
mining tidak hanya berasal dari satu database tetapi juga berasal dari
beberapa database atau file teks. Integrasi data dilakukan pada atribut-
atribut yang mengidentifikasikan entinitas – entinitas yang unik seperti
atribut nama, jenis produk, nomor pelanggan dan lainnya. Integrasi data
perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa
dilakukan pada atribut-atribut yang mengidentifikasikan entitas-entitas
yang unik seperti atribut nama, jenis produk, nomor pelanggan dan
lainnya. Integrasi data bisa menghasilkan hasil yang menyimpang dan
bahkan menyesatkan pengambilan aksi nantinya. Sebagai contoh bila
integrasi data berdasarkan jenis produk ternyata menggabungkan produk
dari kategori yang berbeda, maka akan didapatkan korelasi antar produk
yang sebenarnya tidak ada.
3. Seleksi Data ( Data Selection )
Data yang ada pada database sering kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai untuk dianalisis yang akan diambil
dari database. Sebagai contoh sebuah kasus yang meneliti faktor
kecenderungan orang membeli dalam kasus market basket analysis,
tidak perlu mengambil nama pelanggan, cukup dengan id pelanggan
saja.
4. Transformasi Data ( Data Transformation )
Data diubah atau digabung ke dalam format yang sesuai untuk diproses
dalam data mining. Beberapa metode data mining membutuhkan format
data yang khusus sebelum bisa diaplikasikan. Sebagai contoh beberapa
metode standar seperti analisis asosiasi dan clustering hanya bisa
menerima input data kategorikal. Karenanya data berupa angka numeric
yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini
sering disebut transformasi data.
5. Proses Mining
Merupakan suatu proses utama dimana saat metode diterapkan untuk
menemukan pengetahuan berharga dan tersembunyi dari data yang akan
diproses.
6. Evaluasi pola ( Pattern Evaluation )
Untuk mengidentifikasi pola-pola menarik kedalam knowledge based
yang ditemukan. Dalam tahap ini hasil dari teknik data mining berupa
pola-pola yang khas maupun model prediksi dievaluasi untuk menilai
apakah hipotesa yang ada memang tercapai. Bila ternyata hasil yang
diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat
diambil seperti menjadikannya umpan balik untuk memperbaiki proses
data mining, mencoba metode data mining lain yang lebih sesuai, atau
menerima hasil ini sebagai suatu hasil yang diluar dugaan yang mungkin
bermanfaat.
7. Presentasi pengetahuan ( Knowledge Presentation )
Merupakan visualisasi dan penyajian pengetahuan mengenai metode
yang digunakan untuk memperoleh pengetahuan yang diperoleh
pengguna. Tahap terakhir dari proses data mining adalah bagaimana
memformulasikan keputusan atau saksi dari hasil analisis yang didapat.
Ada kalanya hal ini harus melibatkan orang-orang yang tidak
memahami data mining. Karenanya presentasi hasil data mining dalam
bentuk pengetahuan yang bisa dipahami semua orang adalah satu
tahapan yang diperlukan dalam proses data mining. Dalam presentasi
ini, visualisasi juga bisa membantu mengkomunikasikan hasil data
mining [10]. Berikut contoh tahap-tahap data mining ditunjukkan pada
gambar 2.2.
Gambar 2.2 Tahap-tahap Data Mining

2.2.6 Teknik-teknik Data Mining

Di dalam data mining terdapat beberapa teknik yang dapat dilakukan, yang
dapat digolongkan sebagai berikut:
1. Aturan Asosiasi (Association Rules)
Association rules (aturan asosiasi) atau affinity analysis (analisis afinita)
berkenaan dengan studi tentang “apa bersama apa”. Aturan asosiasi juga sering
dinamakan market basket analysis (analisis keranjang belanja). Aturam
Asosiasi ingin memberikan informasi dalam bentuk hubungan “if-then” atau
“jika-maka”. Aturan ini dihitung dari data yang sifatnya probabilistik.
Analisis asosiasi dikenal juga sebagai salah satu metode data mining yang
menjadi dasar dari berbagai metode data mining lainnya. Khususnya salah satu
tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent
pattern mining) menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien. Penting tidaknya suatu aturan assosiatif dapat diketahui
dengan dua parameter support (nilai penunjang) yaitu prosentase kombinasi
item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya
hubungan antar item dalam aturan assosiatif. Analisis asosiasi didefinisikan
suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat
minimum untuk support (minimum support) dan syarat minimum untuk
confidence (minimum confidence) [5].
2. Pengelompokan Clustering
Clustering termasuk metode yang sudah cukup dikenal dan banyak dipakai
dalam data mining. Sampai sekarang para ilmuwan dalam bidang data mining
masih melakukan berbagai usaha untuk melakukan perbaikan model clustering
karena metode yang dikembangkan sekarang masih bersifat heuristic. Usaha-
usaha untuk menghitung jumlah cluster yang optimal dan pengklasteran yang
paling baik masih terus dilakukan. Dengan demikian menggunakan metode
yang sekarang, tidak bisa menjamin hasil pengklasteran sudah merupakan hasil
yang optimal. Namun, hasil yang dicapai biasanya sudah cukup bagus dari segi
praktis.
Tujuan utama dari metode clustering adalah pengelompokan sejumlah
data/objek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi
data yang semirip mungkin. Dalam clustering metode ini berusaha untuk
menempatkan obyek yang mirip (jaraknya dekat) dalam satu klaster dan
membuat jarak antar klaster sejauh mungkin. Ini berarti obyek dalam satu
klaster sangat mirip satu sama lain dan berbeda dengan obyek dalam cluster-
cluster yang lain. Dalam metode ini tidak diketahui sebelumnya barapa jumlah
cluster dan bagaimana pengelompokkannya.

3. Deskripsi
Terkadang peneliti dan analisis secara sederhana ingin mencoba mencari
data untuk menggambarkan pola dan kecenderungan yang terdapat dalam data.
Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menentukan
keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sdikit
didukung dalam pemilihan presiden. Deskripsi dari pola dan kecenderungan
sering memberikan kemungkinan penjelasan untuk suatu pola atau
kecenderungan.
4. Estimasi
Estimasi hampir sama dengan klasifikasi, kecuali variable target estimasi
lebih kearah numerik dari pada kearah kategori. Model dibangun menggunakan
record lengkap yang menyediakan nilai dari variable target prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variable target
dibuat berdasarkan nilai variable prediksi. Sebagai contoh akan dilakukan
estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur
pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan
antara tekanan darah sistolik dan nilai variable prediksi dalam proses
pembelajaran akan menghasilkan model estimasi. Model estimasi yang
dihasilkan dapat digunakan untuk kasus baru lainnya.
5. Prediksi
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam
prediksi nilai dari hasil akan ada dimasa mendatang. Sebagai contoh prediksi
harga beras dalam tiga bulan yang akan datang, serta contoh lain seperti contoh
prediksi presentasi kenaikan kecelakaan lalu lintas lima tahun depan jika batas
bawah kecepatan dinaikkan. Beberapa metode dan teknik yang digunakan
dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat)
untuk prediksi.
6. Klasifikasi
Dalam klasifikasi, terdapat target variable kategori. Sebagai contoh
penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu pendapatan
tinggi, pendapatan sedang, dan pendapatan rendah. Contoh lain klasifikasi dalam
bisnis dan penelitian adalah:
1. Menentukan apakah suatu transaksi kartu kredit merupakan
transaksi yang curang atau tidak.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah
merupakan suatu kredit yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan
termasuk kategori penyakit apa [7].

2.3 Association Rule


Association rules adalah salah satu task data mining deskriptif yang bertujan
untuk menemukan aturan asosiasif antara item-item data. Langkah utama yang perlu
dalam association rules adalah mengetahui seberapa sering kombinasi item muncul
dalam database, yang disebut sebagai frequent patterns. Pramudiono dalam
menyatakan bahwa penting tidaknya suatu aturan asosiatif dapat diketahui dengan
dua parameter, support yaitu persentase kombinasi item dalam database dan
confidence yaitu kuatnya hubungan antar item dalam aturan asosiatif.

Support dan confidence dituliskan sebagai Persamaan 1 dan Persamaan 2 :

Support ( A → B ) = P ( A ∩B ) (1)

Confidence ( A → B ) = P ( B | A ) (2)

Jika support itemset dari itemset 𝐼 memenuhi minimum support threshold yang
sudah ditentukan maka 𝐼 adalah frequent 𝑘-itemset. Secara umum frequent 𝑘-
itemset dilambangkan dengan 𝐿𝑘. Berdasarkan Persamaan (2) diperoleh :

Support ( A ∪ B)
Confidence ( A → B ) = P ( B | A ) = (3)
Support ( A )

2.4 Algoritma Apriori

Algoritma apriori termasuk jenis aturan asosiasi pada data mining. Aturan
yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis
atau market basket analysis. Analisis asosiasi atau association rule mining adalah
teknik data mining untuk menentukan aturan suatu kombinasi item. Salah satu tahap
analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan
algoritma yang efisien adalah analisis pola frekuensi tinggi (frequent pattern
mining), penting tidaknya suatu asosiasi dapat diketahui dengan dua tolak ukur,
yaitu: support dan confidence. Support (nilai penunjang) adalah presentase
kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian)
adalah kuatnya hubungan antar item dalam aturan asosiasi [5].
Tahap awal dalam algoritma apriori ialah analisis pola pada frekuensi tinggi
yaitu dengan mencari kombinasi item yang memenuhi syarat minimum dengan nilai
support dalam basis data. Nilai support sebuah item diperoleh dengan rumus
berikut:
jumlah transaksi mengandung A
Support (A) = x 100%
total transaksi
Sementara, nilai support dari 2 item diperoleh dengan rumus berikut:
∑ transaksimengandung A dan B
Support (A ∩B) = x 100%
∑transaksi

Frequent itemset menunjukkan pada itemset yang memiliki frekuensi


kemunculan lebih dari nilai yang ditentukan.
Tahap selanjutnya yaitu pembentukan aturan asosiasi, yaitu setelah semua
pola frekuensi tinggi ditemukan, barulah mencari aturan asosiasi yang memenuhi
syarat minimum confidence dengan cara menghitung confidence A→B. Nilai
confidence dari aturan A→B memperoleh rumus berikut:
∑transaksi mengandung A dan B
Confidence = x 100%
∑ transaksi mengandung A

Frequent itemset menunjukkan itemset yang memiliki frekuensi kemunculan


lebih dari nilai yang telah ditentukan pada awal.

2.5 Pembelian

2.5.1 Definisi Pembelian

Pembelian merupakan sebagai usaha yang untuk memenuhi kebutuhan


atas barang dan jasa yang diperlukan oleh perusahaan maupun toko dan dapat
diterima tepat pada waktunya dengan harga yang sesuai.
Maksud dari prmbelian adalah pembelian terjadi untuk memenuhi
kebutuhan dan pemenuhan atas kebutuhan tersebut ada 2 macam, yaitu untuk
dapat digunakan ataupun dapat dijual kembali.

2.5.2 Jenis-jenis Pembelian

1. Pembelian yang teratur


2. Pembelian Spekulatif
3. Pembelian Sebelumnya

2.8 Kerangka Pemikiran


Tabel 2.2 Kerangka Pemikiran

Latar Belakang
Pendapatan yang turun karena terlalu banyak barang yang tidak terjual. Untuk
meningkatkan pendapatan. Untuk mengetahui barang yang sering dibeli dan barang
yang kemungkinan besar terkait juga dibeli pelanggan. Adapun permasalahan lain yang
ada pada Toko Alat Tulis Sumurboto Stationery yaitu sering tidak adanya barang
yang ingin dibeli pelanggan.

Masalah

Bagaimana implementasi metode Assotiation Rule dalam menentukan Market


Basket Analysis pada Toko Alat Tulis Sumurboto Stationery yang dapat
mengidentifikasi barang yang sering dibeli dan bagaimana cara menentukan barang
yang dapat ditawarkan kembali kepada pelanggan pada Toko Alat Tulis Sumurboto
Stationery ?

Tujuan

Mengimplementasikan metode Assotiation Rule dalam menentukan Market Basket


Analysis untuk menentukan barang yang sering dibeli dan penawaran barang kepada
pelanggan yang kemungkinan besar dapat dibeli.

Eksperimen

Data Metode Tools

Data penjualan yang di Assotiation Rule dan Coding : PHP, MySQL


gunakan bulan Desember Algoritma Apriori
2018
Hasil

Dalam penelitian ini dapat menentukan barang yang sering dibeli dan penawaran
barang kepada pelanggan yang kemungkinan besar dapat dibeli.

Anda mungkin juga menyukai