Anda di halaman 1dari 31

Machine Translated by Google

Lihat diskusi, statistik, dan profil penulis untuk publikasi ini di: https://www.researchgate.net/publication/307999858

Evaluasi kinerja pendekatan segmentasi pelanggan yang berbeda berdasarkan analisis RFM dan
demografi

Artikel di Kybernetes · Agustus 2016


DOI: 10.1108/K-07-2015-0180

KUTIPAN BACA

85 4.989

3 penulis:

Peiman Alipour Sarvari Alp Ustundag

Institut Sains dan Teknologi Luksemburg (DAFTAR) Universitas Teknik Istanbul

31 PUBLIKASI 252 KUTIPAN 88 PUBLIKASI 1.920 KUTIPAN

LIHAT PROFIL LIHAT PROFIL

Hidayet Takci

Universitas Sivas Cumhuriyet

50 PUBLIKASI 379 KUTIPAN

LIHAT PROFIL

Beberapa penulis publikasi ini juga sedang mengerjakan proyek terkait berikut:

Penggunaan Algoritma Kecerdasan Buatan dalam Studi Kanker Lihat proyek

Potensi Penerapan Analisis Data dan Pemodelan Matematika pada proyek Tampilan Pengenalan Pola Kanker

Semua konten setelah halaman ini diunggah oleh Peiman Alipour Sarvari pada tanggal 07 Juli 2018.

Pengguna telah meminta penyempurnaan file yang diunduh.


Machine Translated by Google

orang-orang Kybernet

Evaluasi kinerja pendekatan segmentasi pelanggan yang berbeda berdasarkan


Analisis RFM dan demografi
Peiman Alipour Sarvari Alp Ustundag Hidayet Takci

Informasi artikel:
Mengutip dokumen ini:
Peiman Alipour Sarvari Alp Ustundag Hidayet Takci , (2016),"Evaluasi kinerja pendekatan segmentasi pelanggan yang
berbeda berdasarkan analisis RFM dan demografi", Kybernetes, Vol. 45 Iss 7 hal. 1129 - 1157 Tautan permanen ke dokumen
ini: http://dx.doi.org/
10.1108/K-07-2015-0180 Diunduh pada:
14 September 2016, Pukul: 01:14 (PT)

Referensi: dokumen ini berisi referensi ke 52 dokumen lainnya.


Untuk menyalin dokumen ini: perizinan@emeraldinsight.com Teks
lengkap dokumen ini telah diunduh 52 kali sejak 2016*

Pengguna yang mengunduh artikel ini juga mengunduh:


(2016),"Penentuan nilai seumur hidup pelanggan berdasarkan model RFM", Marketing Intelligence & Perencanaan, Jil.
34 Iss 4 hal. 446-461 http://dx.doi.org/10.1108/MIP-03-2015-0060 (2016),"Kompleksitas, teori

jaringan, dan masalah epistemologis", Kybernetes, Vol. 45 Iss 7 hal. 1158-1170 http://dx.doi.org/10.1108/K-05-2015-0125
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

(2016),"Pendekatan RFM untuk pemodelan kebangkrutan

telekomunikasi", Kybernetes, Vol. 45 Edisi 5 hal.815-827 http://dx.doi.org/10.1108/K-04-2015-0113

Akses ke dokumen ini diberikan melalui langganan Emerald yang disediakan oleh emerald srm:181692 []

Untuk Penulis
Jika Anda ingin menulis untuk ini, atau publikasi Emerald lainnya, silakan gunakan informasi layanan Emerald untuk Penulis
kami tentang cara memilih publikasi mana yang akan ditulis dan pedoman pengiriman tersedia untuk semua. Silakan kunjungi
www.emeraldinsight.com/authors untuk informasi lebih lanjut.

Tentang Emerald www.emeraldinsight.com Emerald adalah

penerbit global yang menghubungkan penelitian dan praktik untuk kepentingan masyarakat. Perusahaan ini mengelola
portofolio lebih dari 290 jurnal dan lebih dari 2.350 buku dan volume seri buku, serta menyediakan beragam produk online
serta sumber daya dan layanan pelanggan tambahan.

Emerald mematuhi COUNTER 4 dan TRANSFER. Organisasi ini merupakan mitra Komite Etika Publikasi (COPE)
dan juga bekerja sama dengan Portico dan inisiatif LOCKSS untuk pelestarian arsip digital.

*Konten terkait dan informasi pengunduhan benar pada saat pengunduhan.


Machine Translated by Google

Edisi terkini dan arsip teks lengkap jurnal ini tersedia di Emerald Insight di:
www.emeraldinsight.com/0368-492X.htm

Evaluasi kinerja pendekatan Pendekatan


segmentasi
segmentasi pelanggan yang pelanggan
berdasarkan RFM
berbeda berdasarkan analisis
RFM dan demografi 1129

Peiman Alipour Sarvari dan Alp Ustundag


Universitas Teknik Istanbul, Istanbul, Turki, dan
Hidayet Takci
Universitas Cumhuriyet, Sivas, Turki

Abstrak
Tujuan – Tujuan dari makalah ini adalah untuk menentukan pendekatan terbaik terhadap segmentasi
pelanggan dan mengekstrapolasi aturan terkait berdasarkan pertimbangan keterkinian, frekuensi dan
moneter (RFM) serta faktor demografi. Dalam studi ini, dampak RFM dan atribut demografis ditantang
untuk memperkaya faktor-faktor yang memberikan pemahaman terhadap segmentasi pelanggan.
Berbagai jenis skenario dirancang, dilakukan, dan dievaluasi dengan cermat dalam kondisi pengujian
yang seragam. Data untuk penelitian ini diambil dari database jaringan restoran pizza global di Turki.
Makalah ini merangkum temuan penelitian dan juga memberikan bukti implikasi empirisnya untuk
meningkatkan kinerja segmentasi pelanggan serta mencapai kesempurnaan aturan yang diekstraksi
melalui faktor dan variasi model yang efektif. Dengan demikian, proses pemasaran dan pelayanan
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

akan berjalan lebih efektif dan efisien bagi pelanggan dan masyarakat.
Implikasi dari penelitian ini adalah menjelaskan secara jelas konsep interaksi antara produsen dan
konsumen.
Desain/metodologi/pendekatan – Manajemen hubungan pelanggan, yang bertujuan untuk mengelola
catatan dan mengevaluasi interaksi pelanggan, umumnya dianggap sebagai alat penting bagi
perusahaan yang ingin sukses di pasar global yang berubah dengan cepat. Prediksi perilaku pelanggan
merupakan isu yang penting dan sulit secara strategis karena tingginya varians dan luasnya cakupan
pesanan dan preferensi pelanggan. Jadi untuk memiliki alat yang efektif dalam mengekstraksi aturan
berdasarkan perilaku pembelian pelanggan, mempertimbangkan kriteria berwujud dan tidak berwujud
sangatlah penting. Untuk mengatasi tantangan yang ditimbulkan oleh sifat multifaset dari masalah ini,
penulis menggunakan metode kecerdasan buatan, termasuk pengelompokan k-means, penambangan
aturan asosiasi Apriori (ARM), dan jaringan saraf. Ide utamanya adalah bahwa klaster pelanggan akan
lebih ditingkatkan ketika proses segmentasi didasarkan pada analisis RFM yang disertai dengan data
demografis. Nilai/skor RFM tertimbang (WRFM) dan tidak tertimbang diterapkan dengan dan tanpa
faktor demografi dan digunakan untuk menyusun berbagai jenis dan jumlah cluster. Algoritma Apriori
digunakan untuk mengekstrak aturan asosiasi. Analisis kinerja skenario telah dilakukan berdasarkan
aturan yang diekstraksi ini. Jumlah aturan, waktu yang berlalu, dan akurasi prediksi digunakan untuk
mengevaluasi berbagai skenario. Hasil evaluasi dibandingkan dengan keluaran teknik lain yang
tersedia.
Temuan – Hasil penelitian menunjukkan bahwa memiliki pendekatan segmentasi yang tepat sangat
penting jika ingin ada aturan asosiasi yang kuat. Dari hasil tersebut juga ditentukan bahwa bobot atribut
RFM mempengaruhi kinerja asosiasi aturan secara positif. Selain itu, untuk menangkap segmen
pelanggan yang lebih akurat, kombinasi atribut RFM dan demografi direkomendasikan untuk pengelompokan.
Analisis hasil menunjukkan pentingnya data demografi yang digabungkan dengan WRFM.
Yang terpenting, tantangan ini memperkenalkan rangkaian faktor terbaik untuk analisis pengelompokan
Kybernetes
dan ARM berdasarkan data RFM dan demografi. Vol. 45 No. 7, 2016
Orisinalitas/nilai – Penelitian ini membandingkan metode pengelompokan k-means dan Kohonen dalam hal. 1129-1157
© Emerald Group Publishing Limited
fase segmentasinya untuk membuktikan keunggulan teknik segmentasi yang diadopsi. Selain itu, 0368-492X
penelitian ini menunjukkan bahwa segmen pelanggan berisi skor WRFM dan data demografi yang sama DOI 10.1108/K-07-2015-0180
Machine Translated by Google

K cluster menghasilkan aturan asosiasi yang lebih kuat dan akurat untuk memahami perilaku pelanggan. Apa
yang disebut sebagai pencapaian ini dibandingkan dengan hasil pendekatan klasik untuk mendukung
45,7 kredibilitas metodologi yang diusulkan. Berdasarkan penelitian sebelumnya, metode klasik untuk segmentasi
pelanggan telah mengabaikan kombinasi data demografis dengan WRFM selama pengelompokan sebelum
melanjutkan ke tahap ekstraksi aturan.

Kata Kunci Segmentasi pelanggan, Evaluasi kinerja, Algoritma aturan asosiasi, Variabel
1130 demografi, Analisis RFM, Self-organizing map (SOM)
Jenis kertas Makalah penelitian

1. Pendahuluan
Pada tahun 1990an, dalam dunia bisnis, konsep manajemen hubungan pelanggan (CRM) secara
bertahap muncul, yang berlaku sejak tahun pertama, menjadi terkenal sebagai bidang penelitian
ilmiah dan merangsang minat bisnis dan penelitian global. komunitas (Soltani dan Navimipour,
2016). CRM adalah model operasional dimana perusahaan memahami dan mempengaruhi perilaku
pelanggan melalui interaksi untuk mendapatkan pelanggan baru, mempertahankan pelanggan lama
dan meningkatkan loyalitas pelanggan sehingga meningkatkan keuntungan (Chung dan Chen,
2016). Dihadapkan dengan meningkatnya kompleksitas dan persaingan, perusahaan saat ini perlu
mengembangkan kegiatan inovatif untuk memahami kebutuhan pelanggan dan meningkatkan
kepuasan dan retensi pelanggan (Razieh et al., 2012). Tujuan utama CRM adalah menciptakan
hubungan jangka panjang dan menguntungkan dengan pelanggan. Meningkatnya digitalisasi
transaksi telah menghasilkan peningkatan informasi tentang pelanggan yang disimpan dalam
database transaksional yang besar (Khajvand et al., 2011). Selain itu, ini adalah metode terkuat dan
paling efisien untuk menjaga dan menciptakan hubungan dengan pelanggan (Soltani dan Navimipour,
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

2016).

Clustering adalah proses pengumpulan sekumpulan objek fisik atau abstrak ke dalam kelompok
objek serupa (Hosseini dan Mohammadzadeh, 2016). Penerapan yang menonjol dari pemasaran
basis data adalah pengelompokan pelanggan untuk pemasaran langsung, dimana analis mencoba
menemukan kelompok pelanggan yang homogen sehubungan dengan perilaku respons mereka
menggunakan apa yang disebut alat data mining (DM) (Ambler et al., 2002).
Dalam hal ini, beberapa penulis telah mengusulkan metode pengelompokan lunak, yang memberikan
hasil yang lebih menjanjikan dibandingkan dengan pengelompokan keras serta kualitas
pengelompokan yang lebih baik dalam segmen daripada yang diperoleh dari model campuran
hingga. Wu dan Cho membandingkan distribusi pelanggan untuk pengelompokan keras dan pengelompokan lunak
Dalam pengelompokan lunak, setiap pelanggan memiliki skor keanggotaan campuran yang terkait
dengan setiap kelas laten. Mereka menekankan: segmen mikro untuk perilaku belanja (frekuensi
pembelian dan uang yang dikeluarkan), segmen mikro untuk kepuasan pelanggan online dan
karakteristik demografi pelanggan berdasarkan hasil eksperimen (Coussement et al., 2014).

Dalam beberapa tahun terakhir, teknik pemasaran basis data telah berevolusi dari model
kekinian, frekuensi, dan moneter (RFM) sederhana (model yang melibatkan keterkinian dan frekuensi
pembelian pelanggan, dan pembayaran mereka dalam bentuk uang) menjadi teknik statistik seperti
deteksi interaksi otomatis chi-kuadrat ( CHAID) dan regresi logistik.
Baru-baru ini, model yang menggunakan jaringan syaraf tiruan (JST) telah dianjurkan di banyak
perusahaan untuk digunakan dalam CRM dengan menganalisis informasi pelanggan yang berharga
(CH Cheng dan Chen, 2009; Xu dan Chu, 2015). Kemudahan penggunaan dan penerapannya yang
cepat adalah alasan pemasar terus menggunakan model RFM meskipun teknik DM canggih telah
dikembangkan. Selain itu, mereka mudah dipahami
Machine Translated by Google

manajer dan pengambil keputusan. Meskipun demikian, model RFM memiliki beberapa titik Pelanggan yang buta .
Terutama, kurangnya kemampuan eksplorasi dan peramalan merupakan kualitas segmentasi
negatif dalam model
prediktif. Kedua, mereka mengandaikan pendekatan perilaku berkelanjutan untuk setiap
pelanggan untuk menargetkan
mereka dalam aktivitas promosi. Dengan kata lain, teknik RFM yang didasarkan pada tidak
memperhitungkan dampak
tahapan kehidupan individu atau transisi siklus hidup terhadap kemungkinan respons mereka.
Terakhir, jika hanya segmen RFM yang paling menarik yang digunakan sebagai metode
penargetan utama, terdapat risiko bahwa segmen menguntungkan lainnya mungkin terabaikan. 1131
Untuk studi ini, kami bertujuan untuk mengusulkan algoritme berbeda menggunakan keluaran
analisis RFM pelanggan dan data demografis mereka untuk bentuk skenario berbeda. Untuk
mengekstrak aturan berbasis produk (berbasis proses) yang sebenarnya dari transaksi
pelanggan, segmentasi pelanggan perlu dilakukan dengan menggunakan kelompok target yang
benar. Hingga saat ini analisis berdasarkan segmentasi pelanggan RFM hanya dipertimbangkan
pada indeks RFM. Dengan kata lain, untuk merumuskan model pengelompokan pelanggan yang
komprehensif menggunakan analisis RFM, faktor pembobotan dan atribut lainnya, seperti
variabel demografi, tidak boleh diabaikan. Dikatakan bahwa analisis kinerja semua jenis skenario
akan mendukung gagasan bahwa penyatuan atribut transaksi pelanggan diperlukan untuk
mendapatkan aturan berbasis cluster yang sebenarnya.
Sisa dari penelitian ini disusun sebagai berikut: Bagian 2 memberikan gambaran umum
tentang karya-karya terkait. Bagian 3 menjelaskan faktor model, karakteristik data dan deskripsi.
Bagian 4 menjelaskan metodologi dan algoritma yang diadopsi. Bagian 5 mencakup analisis
empiris dan menunjukkan cara memilih algoritme yang paling sesuai, serta menawarkan
tantangan praktis terhadap metodologi dan analisis kinerja. Kemudian, interpretasi hasil
diberikan. Bagian 6 menantang beberapa tolok ukur dengan membandingkan kinerja metode-
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

metode tersebut dengan pendekatan yang diusulkan. Di Bagian 7 dan 8, kita dapat menemukan
diskusi mengenai implikasi penelitian ini dan kesimpulan makalah ini.

2. Tinjauan literatur CRM


telah menarik banyak perhatian, dan banyak bisnis yang merupakan pengguna akhir solusi
teknologi informasi telah menghabiskan banyak uang untuk berinvestasi dalam penerapan
sistem CRM. Sistem ini, pada tingkat yang lebih besar atau lebih kecil, telah terintegrasi dengan
proses operasional dan bisnisnya. Namun, yang harus diingat adalah bahwa CRM adalah ide
dasar dan masuk akal yang dapat dipraktikkan hanya dengan spreadsheet dan database
sederhana (Nettleton, 2014). Salah satu instrumen terpenting bagi bisnis untuk menyerap dan
mempertahankan pelanggan adalah dengan menerapkan teknik CRM. Dengan teknik seperti itu,
sebuah asosiasi dapat menerapkan strategi berbasis pelanggan untuk meningkatkan hubungan
dengan pelanggan sehingga menghasilkan peningkatan loyalitas dan kepuasan pelanggan serta
retensi yang lebih baik. Selain itu, hal ini berguna untuk meningkatkan hubungan pelanggan dan
kerjasama dengan mereka, dengan mengintegrasikan nilai-nilai pelanggan dan kebutuhan
mereka ke dalam proses bisnis. Tidak diragukan lagi, menganalisis data dari transaksi pelanggan
merupakan aspek yang sangat penting dari CRM. Memperpendek siklus penjualan dan
mengembangkan hubungan yang lebih dekat dengan pelanggan adalah manfaat lain dari CRM
yang baik. Dalam makalah tinjauan literatur mereka, EWT Ngai dkk. (2009) menyebutkan bahwa
CRM dikategorikan menjadi empat dimensi yaitu identifikasi pelanggan, daya tarik pelanggan,
retensi pelanggan, dan pengembangan pelanggan. Terlebih lagi, DM dibagi menjadi tujuh fungsi
(yaitu asosiasi, klasifikasi, pengelompokan, peramalan, regresi, penemuan urutan dan visualisasi)
(Ngai et al., 2009).
Untuk memaksimalkan kinerja CRM oleh suatu perusahaan, perusahaan perlu memiliki
kelompok konsumen dan pelanggan yang jelas dan tersegmentasi. Segmentasi adalah yang pertama
Machine Translated by Google

K diperkenalkan dalam literatur pemasaran oleh W. Smith (1956). Belakangan, Claycamp dan William (1968)
menyebut segmentasi sebagai alternatif strategi diferensiasi produk.
45,7
Ide utama dari segmentasi atau pengelompokan adalah mengelompokkan pelanggan serupa menjadi satu.
Fallis (2013) menyebutkan bahwa ada banyak algoritma clustering dalam literatur. Sulit untuk memberikan
kategorisasi metode pengelompokan yang jelas karena kategori-kategori ini mungkin tumpang tindih sehingga
suatu metode mungkin memiliki fitur dari beberapa kategori dan, secara umum, metode pengelompokan dasar
1132 utama dapat diklasifikasikan sebagai metode partisi (seperti algoritma pengelompokan k-means) , metode
hierarki (seperti algoritma pengelompokan hierarki aglomeratif dan memecah belah), metode berbasis
kepadatan (pengelompokan berbasis kepadatan berdasarkan wilayah terhubung dengan kepadatan tinggi dan
pengelompokan berdasarkan fungsi distribusi kepadatan adalah metode yang paling populer) dan metode
berbasis grid (seperti STING: jaringan informasi statistik) (Fallis, 2013).

Algoritma pengelompokan efektif lainnya adalah self-organizing map (SOM) dari Kohonen, yang terkenal
dengan kemampuannya memetakan ruang masukan dengan jaringan saraf (NN).
(Demartines dan Blayo, 1992), sangat populer untuk mengelompokkan pelanggan saat ini.
Segmen dapat digambarkan sebagai sekumpulan pelanggan yang memiliki kesamaan karakteristik
berdasarkan demografi, perilaku, nilai, dan sebagainya. Pemilihan teknik segmentasi menjadi lebih penting
karena perkembangan teknologi informasi dan komunikasi, khususnya manajemen database dan sistem DM
telah mengubah cara pemasaran.

Ketersediaan data yang luas, dan tidak efisiennya kinerja teknik statistik tradisional (atau alat segmentasi
berorientasi statistik) ketika menangani data dalam jumlah besar, telah mendorong para peneliti untuk
menemukan alat segmentasi yang lebih efektif guna menemukan informasi yang lebih berguna tentang pasar
dan pasar mereka. pelanggan. Dengan demikian, penemuan pengetahuan (KD) dan DM dipandang sebagai
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

solusi permasalahan tersebut.


Disiplin ilmu seperti pembelajaran mesin, statistik, kecerdasan buatan (teknik komputasi lunak dan keras),
sistem pakar, dan teknologi manajemen data dan pengetahuan telah dimasukkan dalam KD dan DM,
memanfaatkan teori dan algoritma mereka (Hiziroglu, 2013). Teichert (2008) mencoba melakukan segmentasi
pelanggan maskapai penerbangan. Mereka menggunakan beberapa faktor demografis dan moneter dan
mengelompokkan pelanggan mereka ke dalam kategori bisnis dan rekreasi. Mereka tidak dapat
menggeneralisasi metode tersebut dan menyimpulkan bahwa temuan mereka meragukan karena kurangnya
frekuensi pelanggan dan faktor loyalitas yang diamati. Chung dan Chen (2016) menggunakan kepentingan
pembelian dan faktor demografi untuk mengelompokkan pelanggan mereka pada titik pertemuan layanan
wajib. Meskipun literatur pemasaran jasa menunjukkan bahwa pelanggan setia lebih cenderung berpartisipasi
dalam produksi jasa dibandingkan pelanggan baru, mereka mengabaikan beberapa faktor penting (frekuensi
dan keterkinian) dan ini membatasi penerapan pekerjaan mereka. Artikel yang disebutkan di atas membahas
segmentasi berbasis non-RFM.

Analisis RFM berasal dari praktik pemasaran langsung oleh perusahaan penjualan katalog pada tahun
1960an (Blattberg et al., 2008). Metodologi RFM sangat efektif untuk segmentasi pelanggan. Menurut Kahan
(1998), RFM mudah digunakan dan umumnya dapat diimplementasikan dengan sangat cepat (Kahan, 1998).
Lebih jauh lagi, ini adalah metode yang dapat dipahami oleh para manajer dan pengambil keputusan (Marcus,
1998). Hu dan Yeh mempertimbangkan transaksi yang tercatat tanpa mengumpulkan informasi pelanggan.
Oleh karena itu, mereka mendefinisikan pola RFM dan mengembangkan algoritme baru untuk menemukan
rangkaian lengkap pola RFM untuk memperkirakan kumpulan pelanggan. Daripada mengevaluasi nilai pola
dari sudut pandang pelanggan (yaitu pola yang tidak hanya sering terjadi, namun melibatkan pembelian baru-
baru ini dan persentase pendapatan yang lebih tinggi), penelitian mereka mengukur peringkat pola secara
langsung dengan mempertimbangkan faktor RFM, menggunakan skor RFM. sering
Machine Translated by Google

pola (Hu dan Yeh, 2014). Sebuah studi oleh Ambler dkk. (2002) menunjukkan bahwa RFM adalah metode Pelanggan kedua
yang paling umum digunakan oleh pemasar langsung, setelah tabulasi silang. Menurut definisi
segmentasi Robert S. Michael,
tabulasi silang adalah distribusi frekuensi gabungan dari kasus-kasus pendekatan berdasarkan dua
atau lebih variabel
kategori. Menampilkan distribusi kasus berdasarkan RFM nilainya pada dua variabel atau lebih dikenal
sebagai analisis tabel
kontingensi dan merupakan salah satu metode analitik yang lebih umum digunakan dalam ilmu sosial.
Salah satu keterbatasan tabulasi silang adalah memakan waktu karena menggunakan sebagian besar
nilai, sedangkan analisis RFM dapat mengelompokkan sebagian besar nilai ke dalam kelas skor. 1133
Coussement dkk. (2014) menyelidiki pengaruh masalah akurasi data – dimensi penting kualitas
data – menggunakan analisis RFM untuk segmentasi pelanggan untuk dua kumpulan data pemasaran
langsung di kehidupan nyata. Terlepas dari ketersediaan metode statistik yang lebih canggih, JA
McCarty dan M. Hastak (2007) menyelidiki RFM, CHAID dan regresi logistik sebagai metode analisis
untuk segmentasi pemasaran langsung, menggunakan dua kumpulan data yang berbeda (McCarty
dan Hastak, 2007).
Pekerjaan ini menunjukkan bahwa RFM dapat memberikan hasil yang mirip dengan CHAID dan
regresi logistik. Secara keseluruhan, penelitian ini menyimpulkan bahwa RFM dapat bekerja pada
tingkat yang dapat diterima dalam banyak situasi pemasaran basis data ketika pemasar langsung
dibatasi dalam menggunakan variabel transaksi dasar. Sementara itu, makalah ini membahas masalah
yang lebih luas bahwa RFM mungkin terlalu memusatkan perhatian pada informasi transaksi dan
mengabaikan informasi perbedaan individu (misalnya nilai, motivasi, gaya hidup) yang sangat penting
untuk menilai preferensi individu. Chu Chai Henry Chan (2008) menyajikan pendekatan yang
menggabungkan penargetan pelanggan dan segmentasi pelanggan untuk strategi kampanye (Chan,
2008). Yen-Liang Chen dkk. menyertakan dua contoh terkini dan moneter dan mengusulkan pola
RFM untuk penambangan pola sekuensial (SPM). Meskipun beberapa peneliti yang mengembangkan
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

metode DM telah mempertimbangkan variabel RFM, makalah ini adalah yang pertama menerapkan
RFM dalam SPM. Pola RFM, sebagai pola sekuensial tradisional, dapat diterapkan dalam berbagai
aplikasi e-commerce, seperti penjualan silang, rekomendasi produk, pemasaran yang dipersonalisasi,
desain e-katalog, dan desain bundel produk (Chen et al., 2009). Investigasi ini mengidentifikasi
perilaku pelanggan menggunakan model RFM dan kemudian menggunakan model nilai seumur hidup
pelanggan (LTV) untuk mengevaluasi usulan pelanggan tersegmentasi. Selain itu, penelitian ini
mengusulkan penggunaan algoritma generik (GA) untuk memilih pelanggan yang lebih tepat untuk
setiap strategi kampanye. Dengan bantuan alat DM, mereka membangun metode segmentasi
pelanggan baru berdasarkan data RFM, demografi, dan LTV (Namvar et al., 2009). Teknik
pengelompokan pelanggan baru mereka terdiri dari dua fase berturut-turut. Pertama, dengan
segmentasi k-means, pelanggan disegmentasi ke dalam kelompok berbeda sehubungan dengan
RFM mereka. Kedua, dengan menggunakan data demografi, setiap cluster dipartisi lagi menjadi
cluster-cluster baru. Mereka mengadopsi metode DM dengan menggabungkan teknik SOM dan k-
means untuk menerapkan model RFM pada salon rambut di Taiwan untuk mensegmentasi pelanggan
dan mengembangkan strategi pemasaran dan mereka menyarankan bahwa menyelidiki karakteristik
demografi pelanggan mungkin menyarankan implikasi pemasaran yang berbeda. Coussement dkk.
tertarik pada kinerja segmentasi. Mereka menyelidiki pengaruh kualitas data pada proses
pengelompokan dan kualitas segmen menggunakan analisis nilai, regresi logistik, dan pohon
keputusan (DT) (Coussement et al., 2014).

Meskipun pengelompokan pelanggan berdasarkan analisis RFM telah dipelajari secara luas di
beberapa makalah, tidak ada yang mencoba menunjukkan bagaimana faktor analisis RFM dan data
demografi dapat mengubah presisi segmen pelanggan. Sepengetahuan kami, semua penelitian yang
mengusulkan analisis RFM untuk segmentasi pelanggan telah mengelompokkan pelanggan dengan
mengabaikan faktor bobot dan data demografi saat melakukan segmentasi.
Machine Translated by Google

K 3. Karakteristik data Pelanggan


mempunyai berbagai ketidaksamaan sesuai dengan karakteristiknya. Dalam literatur pemasaran konsumen
45,7
dan industri, dapat ditemukan beberapa variabel segmentasi, seperti geografis, demografi, firmografi,
perilaku, variabel terkait proses pengambilan keputusan, perilaku pembelian, faktor situasi, kepribadian,
gaya hidup, psikografis dan lain sebagainya (Hiziroglu, 2013 ).

1134
3.1 Data demografi
Demografi adalah statistik pasti untuk kumpulan data populasi pelanggan.
Selain itu, demografi digunakan untuk membedakan studi tentang subset yang dapat diukur.
Pemasaran dan jajak pendapat publik adalah bidang studi lain yang menggunakan data demografi. Secara
umum, etnis, jenis kelamin, usia, status pekerjaan, dll., dianggap sebagai data demografi.

Gambaran perubahan demografi yang berorientasi waktu pada suatu populasi timbul dari tren demografi.
Misalnya, tingkat pengeluaran rata-rata suatu populasi dapat meningkat atau menurun seiring berjalannya
waktu. Baik dispensasi maupun tren nilai dalam variabel demografi merupakan hal yang menarik (Power
dan Elliott, 2006; Ryder, 1965).

3.2 Data RFM


RFM adalah model yang membedakan pelanggan dari kumpulan data melalui tiga atribut: interval konsumsi
pelanggan, frekuensi, dan nilai pembayaran. Definisi rinci RFM adalah sebagai berikut:
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

(1) Keterkinian pembelian terakhir yang ditunjukkan dengan R mengacu pada jangka waktu antara waktu
pembelian terakhir dan waktu survei. Disini state yang diinginkan dipersingkat durasi waktunya
sehingga R semakin besar.

(2) Frekuensi pembelian yang ditunjukkan oleh F menunjukkan jumlah transaksi dalam satu siklus waktu
tertentu. Dalam keadaan yang diinginkan, semakin besar nilai F berarti telah terjadi pengulangan
pembelian yang tinggi.

(3) Nilai moneter pembelian yang ditunjukkan oleh M adalah nilai konsumsi uang yang dikeluarkan
pelanggan selama jangka waktu tertentu. Keadaan yang diinginkan adalah uangnya banyak, jadi
M lebih besar. Meskipun model RFM merupakan metode yang baik untuk membedakan pelanggan
penting dalam jumlah besar data berdasarkan ketiga variabel, terdapat dua penelitian yang
mempunyai pendapat berbeda sehubungan dengan ketiga variabel model RFM. Hughes (1994)
menganggap bahwa ketiga variabel tersebut sama pentingnya dan oleh karena itu bobot ketiga
variabel tersebut identik. Di sisi lain, Stone (1995) menunjukkan bahwa ketiga variabel tersebut
memiliki kepentingan yang berbeda berdasarkan karakteristik suatu industri. Dengan demikian,
bobot ketiga variabel tersebut tidak sama (C.-H. Cheng dan Chen, 2009).

Seseorang dapat mengganti M dengan durasi, yang dapat digunakan untuk menganalisis perilaku
pelanggan, misalnya nilai waktu yang dihabiskan oleh pemirsa radio di saluran tertentu.
Sebagian besar bisnis akan menyimpan catatan transaksi untuk pelanggan mereka. Yang diperlukan
hanyalah tabel berisi nama pelanggan, tanggal pembelian, dan nilai pembelian.
Salah satu metodologinya adalah dengan menetapkan skala 1 sampai 10, dimana 10 adalah nilai maksimum
dan menetapkan rumus agar data sesuai dengan skala tersebut.
Machine Translated by Google

4. Metodologi yang Diusulkan Pelanggan Dalam beberapa tahun terakhir, DM tidak hanya mendapatkan popularitas besar
di bidang penelitian, tetapi juga dalam komersialisasi segmentasi . Saat ini, dengan memanfaatkan alat DM untuk membantu
CRM, beberapa teknik pendekatan , yang meliputi DT, ANN, GA, Association Rule Mining (ARM),
dll., didasarkan pada
RFM yang biasanya digunakan di bidang-bidang seperti teknik, sains, keuangan, dan bisnis untuk
memecahkan masalah
yang berhubungan dengan pelanggan. Secara umum, tidak ada alat DM untuk CRM yang sempurna,
karena ada beberapa ketidakpastian dalam penggunaannya. Misalnya, dengan DT, terlalu banyak
contoh menyebabkan DT besar sehingga menurunkan tingkat akurasi klasifikasi. ANN memiliki 1135
waktu pelatihan yang lama, terutama pada kumpulan data yang besar, dan merupakan proses coba-
coba.
GA menyatu dengan lambat, memiliki waktu komputasi yang lama, dan kurang stabil. ARM dapat
menghasilkan aturan dengan cakupan yang sangat besar sehingga mungkin mubazir (C.-H. Cheng
dan Chen, 2009).
Salah satu tantangan utama bagi setiap perusahaan pemasar adalah mengidentifikasi target
bisnis untuk produk atau layanan mereka. Semua pelanggan memiliki profil dan preferensi tertentu
sebagai target bisnis. Untuk mengembangkan strategi pemasaran dan rencana pemasaran, profil ini
harus ditetapkan dan digunakan. Dalam hal ini, pertama-tama kami mengelompokkan komunitas ke
dalam bentuk pelanggan yang dikelompokkan, dan kemudian, untuk mengekstraksi aturan
pendukung keputusan yang tepat, menggunakan fitur-fitur cluster yang khas. Kami akan menyelidiki
berbagai pendekatan segmentasi berbasis ARM. Kami menggunakan cluster ini untuk penambangan aturan.
Untuk mendapatkan aturan yang paling efektif dengan redundansi yang lebih sedikit, berbagai
kombinasi skenario model telah dirancang, dan performanya telah dievaluasi dengan algoritma
pembelajaran mesin.
Kami menggunakan kemampuan alat yang disebutkan di atas untuk mengembangkan prosedur
CRM berbasis ARM yang logis dan andal. Langkah-langkah individual dari metodologi yang diusulkan
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

untuk upaya ini ditunjukkan pada Gambar 1. Metodologi utama untuk ARM berbasis transaksi
pelanggan berisi lima fase.

4.1 Tahap prapemrosesan data


Tahap prapemrosesan data merupakan tahap pertama penyiapan data mentah sebelum diubah
menjadi data yang telah disempurnakan dan dapat digunakan. Pada tahap ini dilakukan operasi
pengisian, penanganan, transformasi dan diskritisasi pada data mentah. Langkah penyempurnaan
ini mencakup operasi seperti pengaturan nomor atribut, deteksi outlier, normalisasi, diskritisasi, dan
pembuatan hierarki konsep. Hal ini mempengaruhi keakuratan prediksi dan durasi waktu yang
berlalu secara langsung dan positif. Prosedur berikut dilakukan dalam hal ini: Pengurangan dimensi:
atribut yang tidak perlu harus
dihapus, seperti atribut yang hanya memiliki sedikit nilai (yang lain nol) atau hanya memiliki satu
nilai.

Pengisian: nilai yang hilang harus diisi menggunakan metode yang sesuai. Dalam hal ini, kami
mengganti nilai dengan ekspresi tertentu bergantung pada kondisi, jenis, dan nullitasnya
menggunakan MATLAB dan IBM SPSS.
Penanganan: outlier dan nilai yang tidak akurat harus ditangani dan dihapus dari kumpulan data.

Transformasi: data harus diubah ke dalam format yang sesuai.


Diskritisasi: sebelum tugas ARM, atribut berkelanjutan harus dikodekan dengan mendiskritisasi
nilai asli ke dalam sejumlah kecil rentang nilai. Karena mereka mempunyai nilai yang berbeda untuk
hampir setiap kasus, dengan kardinalitas yang tinggi mereka memberikan sedikit informasi yang
berarti bagi proses ARM (Birant, 2003).
sreabthilm
suukrbe
d4ia6
ntnv1
)hp
d1
ka
T
iu:e
n
a0
e1tP
4 ilsU
D
P
S
T
o(I
0
1
2

K
45,7

1136

Gambar 1.
Metodologi

diagram alur
langkah operasi
yang diusulkan dan
nasesorlm
aeatsw
eaaP
af
d

nakanisrukpam
sgnenasariT
dy
iskhaastna
natearm
T
d
isamrofsnarT isasitirksiD
naisI nanagnaneP
Machine Translated by Google

atad

naklisahgneM naiksla
ista
nheg
mngeeM
s naklisahgneM

oinraianseekD
s naoliura
pnmeukK
s

insaagirnaeVl isaMirF
aRV

esaf
isairav

amstinroage-lm
A
K
amtirirooirgplA
a

MFR
takgnanreapruetS
a

siseila
sanF
a

sisilana sisiM
laR
nA nakroaisraanderekb
s
isatnemgeS

sisilanA

nnaanginku
akynu
eaD
K
d

isapu
jare
lhanaviT
e
k

narruotm
aroeN
p
uultakla
reW
b

takgnit

nagnidnabirreaP
d

oiraneks
sesnoarP
d

nam
katn
irgu
ongaild
a
y

nakgnluidpnm
aiB
s

sluepsm
orip
s
nakanusgisg
riolnatN
e
kna
m
N
Af

isaruolatkvaEf

esaf
luapramcia
s

luspaism
taid
b
s

nanapmluiypnmeip
s
Machine Translated by Google

4.2 Tahap perancangan skenario Pelanggan Keluaran dari tahap ini adalah data transaksi yang disempurnakan. Setelah
ini, ini menjadi database segmentasi utama kami untuk analisis selanjutnya. Data kami berisi faktor-faktor spesifik dan
gagasan pendekatan utama dari penelitian ini didasarkan pada alur analisis faktor. Jadi untuk
menangkap aliran terbaik
dan paling akurat berdasarkan RFM , pada tahap kedua metodologi ini, kami mencoba
mengembangkan seluruh analisis
skenario yang mungkin. Setiap skenario individu merupakan kombinasi rangkaian faktor dan
spesifikasinya yang berbeda. Pada fase ini, berbagai kombinasi analisis RFM, segmentasi, dan
ARM telah dirancang dan disimpan sebagai rangkaian skenario analisis. 1137

Atribut dan tipe data yang berbeda di setiap transaksi mengarahkan kami untuk menyediakan
tipe skenario komprehensif yang mencakup semua kemungkinan konfigurasi melalui aplikasi DM
dasar. Analisis RFM memiliki tujuh keluaran berbeda; Nilai RFM dan skor RFM (skor keterkinian,
skor frekuensi, dan skor moneter) serta skor RFM rata-rata (rata-rata tertimbang skor RFM).
Sementara itu, nilai RFM dikelompokkan dalam lima kategori skor dari 1 hingga 5. Selain itu,
terdapat kombinasi berbeda dari pembobotan kepentingan untuk analisis RFM tertimbang (WRFM)
yang digunakan untuk tes ini. Cluster mungkin berisi nilai WRFM saja atau nilai WRFM dengan data
demografi. Tabel I menggambarkan 42 kemungkinan jenis skenario yang dihasilkan dari data
transaksi pelanggan reguler.
Misalnya, dalam skenario 1, nilai RFM dengan bobot yang sama (WR ¼ WF ¼ WM) dipertimbangkan
pada langkah segmentasi dan faktor demografi, yang telah digunakan untuk berbagai analisis
selama langkah ARM. Contoh lain, untuk skenario 22, pada langkah segmentasi, skor RFM
digunakan bersama dengan faktor demografi. Perlu dicatat bahwa, dalam skenario ini, bobot
moneter dan frekuensi sama dan lebih tinggi dibandingkan bobot terkini (WM ¼ WF4WR). Dengan
kata lain, untuk skenario 15-28 dan 37-42, data demografi telah digunakan bersama dengan
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

keluaran RFM selama proses pengelompokan, dan dalam skenario lain kami menggunakan data
demografi hanya pada langkah ARM. Skenario 1, 8 dan 30 adalah pendekatan paling umum dalam
literatur yang menggunakan faktor RFM hanya mencakup WR ¼ WF ¼ WM selama fase
pengelompokan (Coussement et al., 2014).

4.3 Tahap Analisis


Pada tahap analisis, setiap skenario dijalankan dan dianalisis. Hasil analisis ini disimpan sebagai
seperangkat aturan berdasarkan skenario. Fase ini berisi kinerja tiga langkah tetap yaitu analisis
RFM, segmentasi, dan analisis ARM. Namun, setiap analisis dijalankan dalam skenario yang
berbeda.
4.3.1 Analisis RFM. Analisis RFM adalah teknik pemasaran yang digunakan untuk menganalisis
perilaku pelanggan, seperti kapan pelanggan membeli akhir-akhir ini (keterkinian), seberapa sering
pelanggan membeli (frekuensi), dan berapa jumlah pembelian yang telah dibelanjakan pelanggan
(moneter). Ini adalah metode yang berguna untuk meningkatkan segmentasi pelanggan dengan
membagi pelanggan ke dalam berbagai kelompok untuk layanan personalisasi di masa depan dan
untuk mengidentifikasi pelanggan yang cenderung memiliki kecenderungan untuk merespons
promosi. Analisis RFM bergantung pada ukuran keterkinian (R), frekuensi (F), dan moneter (M)
yang merupakan tiga variabel penting terkait pembelian yang dipengaruhi oleh kemungkinan
pembelian di masa depan. Perhitungan terkait ditunjukkan pada persamaan berikut:

R Cð Þ¼i
RiRMin (1)
RMaxRMin
Machine Translated by Google

K
Fase segmentasi Aturan asosiasi
45,7 Fase analisis RFM Faktor segmentasi fase penambangan
Bobot RFM Keluaran RFM Penambangan aturan asosiasi
WR: berat
kebaruan; WF: berat
frekuensi; WM: RFM RFM RFM Demografis Dengan Tanpa
1138 Skenario bobot moneter skornilai rata-rata faktor demografi demografi

1 WR ¼ WF ¼ WM | |

2 WR4WF ¼ WM | |

3 WF4WR ¼ WM | |

4 WM4WR ¼ WF | |
5 WR ¼ WF4WM | |

6 WM ¼ WR4WF | |

7 WM ¼ WF4WR | |
8 WR ¼ WF ¼ WM | |

9 WR4WF ¼ WM | |

10 WF4WR ¼ WM | |

11 WM4WR ¼ WF | 12 |

WR ¼ WF4WM | |

13 WM ¼ WR4WF | |

14 WM ¼ WF4WR | 15 |

WR ¼ WF ¼ WM || |
16 WR4WF ¼ WM || |
17 WF4WR ¼ WM || |
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

18 WM4WR ¼ WF || |
19 WR ¼ WF4WM || |
20 WM ¼ WR4WF || |
21 WM ¼ WF4WR || |
22 WM ¼ WF4WR || |
23 WR ¼ WF ¼ WM || |
24 WR4WF ¼ WM || |
25 WF4WR ¼ WM || |
26 WM4WR ¼ WF || |
27 WR ¼ WF4WM || |
28 WM ¼ WR4WF || |
29 WM ¼ WF4WR | 30 |

WR ¼ WF ¼ WM | |

31 WR4WF ¼ WM | |

32 WF4WR ¼ WM | |

33 WM4WR ¼ WF || |
34 WR ¼ WF4WM |

35 WM ¼ WR4WF | |

36 WM ¼ WF4WR || |
37 WR ¼ WF ¼ WM || |
38 WR4WF ¼ WM || |
Tabel I.
39 WF4WR ¼ WM || |
Semua 42 mungkin
40 WM4WR ¼ WF || |
jenis skenario 41
diinduksi dari WR ¼ WF4WM || |
pelanggan tetap 42 WM ¼ WR4WF || |
data transaksi Catatan: |, atribut dipilih
Machine Translated by Google

Pendekatan
FiFMin (2) segmentasi
F Cð Þ¼i
FMaxFMin pelanggan
berdasarkan
MiMMin RFM (3)
M Cð Þ¼i
MMaxMMin
1139
dimana R(Ci), nilai kekinian dari i pelanggan; Ri, durasi telah berlalu sejak pelanggan terakhir
membeli; RMin, durasi minimum berlalu sejak pelanggan terakhir kali membeli; RMax, durasi
maksimum yang terlewati sejak pelanggan terakhir kali membeli; F(Ci), nilai frekuensi i pelanggan;
Fi, frekuensi pembelian pelanggan ke-i; FMin, frekuensi pembelian minimum setiap pelanggan; FMax,
frekuensi pembelian maksimum setiap pelanggan; M(Ci), nilai moneter i pelanggan; Mi, nilai uang
pelanggan saya; MMin, nilai uang minimum pembelian pelanggan; dan MMax, nilai moneter
maksimum pembelian pelanggan.

4.3.2 Segmentasi. Transaksi pembelian dan pelacakan perilaku pembelian pelanggan


disegmentasi selama fase segmentasi pelanggan.
Segmentasi pelanggan adalah metodologi DM penting yang digunakan dalam CRM. Ada banyak
pendekatan terhadap pengelompokan dan algoritma dalam literatur yang ada. Kami telah memperkenalkan
dan membandingkan dua di antaranya untuk memilih algoritma terbaik di bawah ini.
Algoritma pengelompokan K-means. Metode pengelompokan k-means menerima D sebagai
kumpulan data masukan, angka, K, segmen yang akan dibentuk, dan fungsi dist(Xi, Xk) yang
menunjukkan semacam homogenitas antara setiap pasangan inspeksi.
islU
D
P
S
T
o(I
0
1
2

Misalkan Ch, h ¼ 1, 2, …, K adalah sebuah cluster yang pusat massanya didefinisikan sebagai
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 e
Tiu:en
ka 1tP
a0
4

titik zh yang koordinatnya sama dengan rata-rata setiap fitur untuk pengamatan yang termasuk
dalam cluster tersebut. Itu adalah:

P Xi ACh xij
Zhj ¼ (4)
kartu Cf gh

BEGITU. SOM adalah alat yang sangat baik yang digunakan pada fase eksplorasi DM. Ini
memproyeksikan ruang masukan pada prototipe grid reguler berdimensi rendah yang dapat
dimanfaatkan secara efektif untuk memvisualisasikan dan mengeksplorasi properti data (Vesanto dan Alhoniemi, 2000).
Seperti kebanyakan ANN, SOM beroperasi dalam dua mode: pelatihan dan pemetaan. “Pelatihan”
membangun peta menggunakan contoh masukan (proses kompetitif, juga disebut kuantisasi vektor),
sementara “pemetaan” secara otomatis mengklasifikasikan vektor masukan baru. SOM terdiri dari
komponen yang disebut node atau neuron. Terkait dengan setiap node adalah vektor bobot dengan
dimensi yang sama dengan vektor data masukan dan posisinya dalam ruang peta. Susunan node
yang biasa adalah spasi teratur dua dimensi dalam kotak heksagonal atau persegi panjang. SOM
mendeskripsikan pemetaan dari ruang masukan berdimensi lebih tinggi ke ruang peta berdimensi
lebih rendah. Prosedur untuk menempatkan vektor dari ruang data ke dalam peta adalah dengan
mencari node dengan vektor yang mempunyai bobot terdekat (metrik jarak terkecil) terhadap vektor
ruang data (Ultsch dan Siemon, 1990). Algoritma Kohonen adalah alat pengelompokan paling
terkenal berdasarkan SOM. Seperti yang telah ditunjukkan di Bagian 5.2, kualitas pengelompokan
dan waktu proses adalah alasan kognitif paling meyakinkan yang meyakinkan kami untuk
menggunakan algoritma segmentasi k-means karena membagi n observasi ke dalam k cluster jika
dibandingkan dengan algoritma Kohonen (SOM). Algoritma k-means mengelompokkan observasi
dengan mean terdekat ke dalam cluster yang sama.
Machine Translated by Google

K 4.3.3 Penambangan aturan asosiasi dan algoritma. ARM adalah metode terkenal untuk
mengekstraksi hubungan antara fitur dan faktor dalam kumpulan data berskala besar. Dipercaya untuk
45,7
mengekstrak aturan dan prinsip yang dapat diandalkan dengan menggunakan dimensi kepentingan
yang berbeda. Banyak algoritma untuk menghasilkan aturan asosiasi telah disajikan seiring berjalannya
waktu. Tiga algoritma paling populer disajikan sebagai berikut.
Algoritma pertumbuhan FP. Penambangan pola yang sering memainkan peran penting untuk
1140 asosiasi penambangan (Agrawal et al., 1993, 1996; Mannila et al., 1994; Nichol et al., 2008), korelasi
(Brin et al., 1997), kausalitas (Silverstein et al., 1997) ., 1998), pola sekuensial (Agrawal dan Srikant,
1994), episode (Mannila et al., 1997), pola multidimensi (Yusof dan Kraak, 2015), pola maks (Bayardo,
1998), periodisitas parsial (Han et al. , 1999), pola yang muncul (Yu et al., 2011) dan banyak tugas DM
penting lainnya.

Misal I ¼ {a1, a2, …, am} adalah himpunan item, dan basis data transaksi DB ¼ ÿT1, T2, …, Tnÿ,
dengan Ti (iÿ[1, ..., n]) adalah transaksi yang berisi sekumpulan item dalam I. Dukungan (atau frekuensi
kemunculan) dari pola A, dimana A adalah sekumpulan item, adalah jumlah transaksi yang berisi A
dalam DB. Pola A sering terjadi jika dukungan A tidak kurang dari ambang batas dukungan minimum
yang telah ditentukan, ÿ. Mengingat DB basis data transaksi dan ambang dukungan minimum ÿ,
masalah menemukan kumpulan pola frekuensi yang lengkap disebut masalah penambangan pola
frekuensi.
Algoritma Eclat. Éclat adalah singkatan dari “transformasi kelas ekuivalen” dan merupakan algoritma
pencarian mendalam yang menggunakan perpotongan himpunan. Ini adalah algoritma elegan alami
yang cocok untuk eksekusi sekuensial dan paralel dengan properti peningkatan lokalitas. Ini pertama
kali diperkenalkan oleh Zaki dkk. (1997) dalam serangkaian makalah yang ditulis pada tahun 1997.
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

apriori. Apriori adalah algoritma penting untuk menemukan kumpulan item yang sering menggunakan
pembangkitan kandidat. Ini dicirikan sebagai algoritma pencarian lengkap berdasarkan level
menggunakan kumpulan item yang anti-monotonisitas. Jadi, “jika suatu kumpulan item tidak sering,
maka superset mana pun tidak akan pernah sering”. Berdasarkan konvensi, Apriori berasumsi bahwa
item dalam suatu transaksi atau kumpulan item diurutkan dalam urutan leksikografis (Wu et al., 2008).
Algoritma Apriori diusulkan oleh Agarwal dan Srikant pada tahun 1994. Apriori dirancang untuk
beroperasi pada database yang berisi transaksi (misalnya kumpulan barang yang dibeli oleh pelanggan,
atau rincian frekuensi situs web). Setiap transaksi dipandang sebagai sekumpulan item (an item set).
Dengan adanya ambang batas C, algoritma Apriori mengidentifikasi kumpulan item yang merupakan
subset dari setidaknya transaksi C dalam database. Apriori menggunakan pendekatan “bottom-up”,
yaitu subkumpulan yang sering diperluas satu item pada satu waktu (sebuah langkah dikenal sebagai
pembuatan kandidat), dan kelompok kandidat diuji berdasarkan data.
Algoritme berakhir ketika tidak ada lagi ekstensi yang berhasil ditemukan. Ini menghasilkan calon
kumpulan item dengan panjang K dari kumpulan item dengan panjang Kÿ1. Kemudian ia memangkas
kandidat yang memiliki subpola yang jarang. Kumpulan kandidat berisi semua kumpulan item dengan
panjang K yang sering. Setelah itu, ia memindai database transaksi untuk menentukan kumpulan item
yang sering muncul di antara para kandidat.
Pseudocode untuk algoritme diberikan di bawah ini untuk database transaksi T dan ambang batas
dukungan e. Notasi teori himpunan biasa digunakan, meskipun perlu dicatat bahwa T adalah multiset.
Ck adalah kandidat yang ditetapkan untuk level k. Pada setiap langkah, algoritme diasumsikan
menghasilkan himpunan kandidat dari himpunan item besar pada level sebelumnya, dengan
memperhatikan lemma penutupan ke bawah. Hitungan (c) mengakses bidang struktur data yang
mewakili himpunan kandidat c, yang awalnya diasumsikan nol.
Banyak rincian yang dihilangkan di bawah ini, biasanya merupakan bagian terpenting dari implementasi
Machine Translated by Google

adalah struktur data yang digunakan untuk menyimpan himpunan kandidat, dan menghitung frekuensinya Pendekatan
(Agrawal dan Srikant, 1994). segmentasi
Apriori(T,ÿ)
pelanggan
L1ÿ{1ÿitem set besar} kÿ2
berdasarkan RFM
sedangkan Lkÿ1ÿÿ
Ckÿ{aÿ{b}|a ÿ Lkÿ1ÿbÿ a}ÿ{c|{s|sÿcÿ|s | ¼ kÿ1}ÿ Lkÿ1} untuk transaksi tÿT 1141
Ctÿ{c|c ÿCkÿcÿ t} untuk
kandidat c ÿCt

hitungan[c]ÿhitungan[c]+1
Lkÿ{c|c ÿCkÿhitungan[c]ÿÿ } kÿk+1

akan kembali [ k Aku

Berdasarkan analisis Bagian 5.3, kami menanamkan ketiga algoritma aturan asosiasi dalam kumpulan data
kami dan setelah perbandingan analisis, algoritma Apriori keluar sebagai pembuat aturan terkuat
dibandingkan dengan algoritma lainnya.

4.4 Tahap evaluasi kinerja Pada akhir


tahap analisis, kami memperoleh aturan yang berbeda dari skenario yang berbeda dengan alur dan aliran
analisis yang berbeda. Jelas bahwa kami perlu membedakan jenis skenario dan aliran faktor terbaik. Oleh
karena itu, penggunaan teknik evaluasi kinerja yang tepat untuk menilai semua jenis skenario tidak dapat
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

dihindari. Sementara itu, kami perlu membandingkan hasil metodologi yang kami usulkan dengan teknik
analisis kinerja lain yang tersedia. Selama tahap evaluasi kinerja, nomor aturan, kepercayaan dan nilai
dukungan digunakan untuk evaluasi faktor. Fase ini mencoba memilih skenario terbaik dari sejumlah besar
jenis skenario.

Berdasarkan bagian sebelumnya, untuk mendapatkan aturan yang paling komprehensif dan akurat,
kami perlu memperkaya dan akurat faktor pengelompokan untuk membedakan hasil pengelompokan yang
lebih baik. Evaluasi akurasi prediksi adalah bagian dari proses pengembangan model dan didasarkan pada
indikator numerik tertentu. Dimungkinkan untuk menentukan ukuran kualitas dan signifikansi yang masuk
akal untuk metode pengelompokan. Di akhir langkah ARM, kami memiliki seperangkat aturan dan
spesifikasinya per jenis skenario.
Spesifikasi ini merupakan kriteria yang sangat penting untuk evaluasi kinerja suatu skenario. Kriteria ini
diperkenalkan di bawah ini.
4.4.1 Jumlah aturan. Faktor terpenting dari ARM adalah jumlah aturan ekstraksi. Semakin besar jumlah
rule pada tingkat kepercayaan dan dukungan preregulated tertentu menunjukkan keakuratan proses
ekstraksi rule. Dalam kondisi yang sama untuk semua jenis skenario, jumlah aturan yang diekstraksi diukur
untuk menentukan deskripsi aturan secara detail.

4.4.2 Waktu yang telah berlalu. Salah satu faktor yang paling penting untuk analisis kinerja suatu teknik
atau aliran adalah bagian waktu di mana suatu masalah diselesaikan oleh pemecahnya. Waktu yang berlalu
adalah selisih antara waktu mulai dan waktu selesainya suatu proses. Untuk eksperimen ini, kami
menghitung dan membandingkan waktu yang berlalu dari setiap jenis skenario.

4.4.3 Tingkat kepercayaan dan dukungan. Keyakinan dan dukungan adalah dua ukuran evaluasi aturan
asosiasi. Misalkan dua himpunan item adalah LO dan HO sehingga L ÿ H ¼ ÿ dan a
Machine Translated by Google

K kumpulan data T. Aturan asosiasi merupakan konsep stokastik yang dilambangkan dengan LÿH
yang berarti jika T mencakup L, maka T juga mencakup H dengan probabilitas p, yang disebut
45,7
kepercayaan aturan di D, didefinisikan sebagai :
fðL [ HÞ p
¼ conf Lf g¼ ) H fðLÞ (5)

1142
Aturan LÿH dikatakan mempunyai support s pada D jika rasio transaksi mencakup keduanya
L dan H sama dengan s, yaitu jika:
fðL [ HÞ s
¼ supf g¼ L ) H (6)
M

Dukungan suatu aturan menyatakan rasio transaksi yang mengandung anteseden dan konsekuensi
dari aturan tersebut.

4.5 Membandingkan dan mengevaluasi cluster menggunakan


fase NN Untuk memverifikasi keakuratan analisis kinerja, kita harus mengevaluasi kinerja skenario
dengan menggunakan fase evaluasi faktor yang terpisah. Fase ini, yang didasarkan pada logika
NN, merupakan upaya untuk mengevaluasi tingkat pengayaan berbagai faktor yang merupakan
elemen dasar aturan yang diekstraksi. Hal ini memungkinkan kami untuk membandingkan hasil
kami. Rincian setiap fase diperiksa selanjutnya.
NN adalah model sederhana tentang cara sistem saraf beroperasi. Unit dasarnya adalah
neuron, yang biasanya disusun dalam beberapa lapisan. NN, terkadang disebut perceptron
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

multilayer, pada dasarnya adalah model sederhana cara otak manusia memproses informasi. Ia
bekerja dengan mensimulasikan sejumlah besar unit pemrosesan sederhana yang saling
berhubungan yang menyerupai versi abstrak neuron. Unit pemrosesan disusun berlapis-lapis.
Biasanya ada tiga bagian dalam NN: lapisan masukan, dengan unit yang mewakili bidang
masukan; satu atau lebih lapisan tersembunyi; dan lapisan keluaran, dengan satu atau beberapa
unit yang mewakili bidang keluaran. Unit-unit tersebut dihubungkan dengan kekuatan sambungan
(atau bobot) yang berbeda-beda. Data masukan disajikan ke lapisan pertama, dan nilai disebarkan
dari setiap neuron ke setiap neuron di lapisan berikutnya. Akhirnya, hasilnya dikirimkan dari
lapisan keluaran. Jaringan belajar dengan memeriksa catatan individual, menghasilkan prediksi
untuk setiap catatan dan membuat penyesuaian pada bobot setiap kali jaringan membuat prediksi
yang salah. Proses ini diulang berkali-kali, dan jaringan terus meningkatkan prediksinya hingga
satu atau lebih kriteria penghentian terpenuhi.
Untuk dapat membandingkan hasil analisis dan memverifikasi aliran dan skenario pilihan
terbaik, kami perlu menggunakan NN untuk analisis faktor. Peran analisis NN adalah untuk
memprediksi tingkat penjualan setiap produk, berdasarkan berbagai jenis bentuk faktor. Jadi di
akhir analisis prediksi kita harus mengetahui tingkat pentingnya suatu faktor tertentu. Dengan
kata lain, ketika mengelompokkan kumpulan data tertentu dengan kombinasi atribut yang berbeda,
penggunaan NN dapat membantu menemukan faktor paling penting untuk memprediksi tingkat
preferensi produk tertentu oleh pelanggan kumpulan data tersebut. Untuk langkah ini, kami
mencoba menemukan fitur dan atribut terpenting yang memengaruhi faktor tertentu.
Dengan menggunakan pendekatan ini, kami dapat mengukur dampak dari berbagai klaster yang
telah dibentuk dari berbagai skenario. Jika tingkat kepentingan klaster tinggi, kita dapat yakin
bahwa klaster kita cukup diperkaya; jika tidak, metode pengelompokan atau kombinasi atribut
yang menghasilkan hasil pengelompokan harus sudah ada
urutan yang salah.
Machine Translated by Google

5. Analisis empiris dan hasil Pelanggan Ekstraksi transaksi berbasis web dari database rantai segmentasi restoran
pizza global telah disajikan. Struktur data transaksi dibentuk dari identifikasi pendekatan pelanggan , pembelian
produk dan data demografinya. Untuk analisis RFM empiris ini , kami mencoba mengekstrak
aturan dan hubungan
yang paling akurat dan andal antara atribut data yang berbeda. Aturan-aturan ini berguna untuk
CRM dan rekomendasi
produk yang lebih baik.

1143
5.1 Struktur data
Pertama-tama, kami menganalisis struktur kumpulan data kehidupan nyata, yang dikumpulkan
dari jaringan restoran pizza global di Turki. Ini memiliki lebih dari dua setengah juta transaksi
berbeda untuk pelanggan dengan nomor identifikasi pelanggan (ID).
Atribut kumpulan data lainnya adalah; tanggal pemesanan, kota tempat tinggal pelanggan,
kategori jenis kelamin/gender, kategori umur (diperoleh dari atribut tanggal lahir melalui
preprocessing data), pembayaran atau pengeluaran pelanggan per pesanan, dan atribut-atribut
lain yang menunjukkan produk. Kumpulan data memiliki tujuh atribut demografis dan 49 atribut
produk. Gambar 2 mengilustrasikan beberapa di antaranya.
Seperti terlihat pada Tabel II, seluruh transaksi untuk pelanggan tertentu digabungkan,
dihitung dan dianalisis. Hasilnya menunjukkan, setiap pelanggan diidentifikasi berdasarkan ID
dan atribut lain yang disajikan masing-masing adalah nilai terkini, nilai frekuensi, nilai moneter,
skor terkini, skor frekuensi, skor moneter, dan skor RFM rata-rata. Berkat analisis ini, informasi
RFM dapat digunakan sebagai jenis atribut data tambahan untuk diproses.
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

5.2 Pemilihan algoritma segmentasi terbaik Pada


tahap ini kami melakukan segmentasi pada kumpulan data, menggunakan algoritma k-means
dan Kohonen (SOM), untuk memilih algoritma clustering terbaik untuk metodologi kami.
Hasil analisis segmentasi untuk seluruh 2.553.470 transaksi, baik menggunakan algoritma K-
means maupun Kohonen, telah diilustrasikan pada Gambar 3. Sembilan cluster dilakukan
dengan menggunakan algoritma Kohonen dan waktu yang dibutuhkan untuk analisis ini adalah
20 menit 25 detik. Sebagai perbandingan, algoritma k-means menghasilkan lima cluster (yang
telah dihitung sebelumnya menggunakan indeks Dunn) yang dihasilkan hanya dalam 25 detik.
Melihat Gambar 3, terlihat jelas bahwa hasil cluster yang dibuat oleh Kohonen hanya berisi tiga
record dan menunjukkan bahwa jumlah cluster harus disesuaikan. Jelasnya, kualitas
pengelompokan dan waktu proses algoritma k-means lebih dapat diandalkan. Berdasarkan
faktor-faktor ini, penerapan algoritma k-means diharapkan dapat meningkatkan keunggulan metodologi kami.
Pada tahap clustering, output dan kualitas cluster yang dihasilkan dari menjalankan
algoritma k-means sangat bergantung pada pemilihan jumlah cluster yang tepat. Untuk memilih
jumlah cluster yang optimal, terdapat banyak indikator seperti indeks Davies Bouldin, lebar
siluet atau indeks Dunn. Dalam pekerjaan ini kami menggunakan indeks Dunn. Indeks Dunn
mengukur kekompakan (jarak maksimum antara titik data cluster) dan pemisahan cluster (jarak
minimum antar cluster). Pengukuran ini berfungsi untuk menemukan jumlah cluster yang tepat
dalam suatu kumpulan data, dimana nilai maksimum indeks mewakili partisi yang tepat
berdasarkan indeks tersebut (Pakhira et al., 2004).
Tujuan dari semua indeks ini adalah untuk mendapatkan cluster yang bermakna dimana
objek data dalam cluster yang sama serupa satu sama lain dan berbeda dengan objek di
cluster lain. Dalam penelitian ini, kami mengevaluasi angka optimum sebagai K ¼ 5,
berdasarkan Indeks Dunn, untuk digunakan sebagai jumlah cluster dalam algoritma k-means.
Machine Translated by Google

K
45,7

1144
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 ilsU
1tP D
P
S
T
o(I
0
1
2

Gambar 2.
Pengambilan
sebagian kumpulan
data termasuk
atribut dan transaksi
Machine Translated by Google

Pelanggan
Kebaruan Frekuensi Keuangan RFM rata-rata
PENGENAL
Moneter Frekuensi Terkini skor skor skor skor segmentasi
pendekatan
247968 300 3 669 1 3 4 1.420.0
926746 300 3 3 5
berdasarkan RFM
4.092 1 1.620.0
821702 300 3 751 1 3 4 1.420.0
716158 300 1 139 1 1 1 420.0
1145
260212 300 4 4.980 1 4 5 1.820.0
812921 300 1 139 1 1 1 420.0
964319 300 24127 1 139 1 1 1 420.0
300 649539 300 3 409 1 3 4 1.420.0
833556 300 1 165 1 1 2 620.0 Tabel II.
945488 300 3 3 4.682 1 3 5 1.620.0 Perhitungan RFM
9396 300 3 328 3 3 hasil untuk masing-masing
1 1.220.0
4 288 1 4 2 1.220.0 pelanggan

5.3 Pemilihan algoritma ARM terbaik


Apriori (SPSS Clementine v12), Eclat dan FP-growth (versi 0.99.491 – © 2009-2015
RStudio, Inc.) Algoritma ARM diterapkan pada kumpulan data dan hasil analisis
diilustrasikan pada Tabel III selanjutnya. Sejumlah aturan, dukungan minimal
persentase, persentase kepercayaan minimum dan waktu yang berlalu adalah perbandingan
kriteria. Jelas kinerjanya (tingkat dukungan dan kepercayaan minimum dan juga
waktu berlalu yang lebih singkat) Apriori lebih menguntungkan dibandingkan dengan dua lainnya
algoritma. Sebaliknya, semakin banyak aturan yang diungkapkan semakin rinci
aturan asosiasi.
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

Pada langkah aturan asosiasi, kami bermaksud menggunakan Apriori dengan tingkat kepercayaan tetap
hingga 80 dan dukungan hingga 20 untuk semua jenis skenario.

5.4 Melakukan tipe skenario


Semua 42 skenario pada Tabel I, yang tertanam dalam aliran ditunjukkan pada Gambar 4, Masing-masing
jenis skenario dimodelkan oleh SPSS Clementine v12. Di semua aliran model yang kami gunakan
Analisis RFM, k-means dan alat algoritma Apriori. Berdasarkan setiap jenis skenario,
pilihan alat diatur. Dalam pengujian ini, kami menggunakan lima kacang untuk RFM dengan berbeda
kombinasi bobot satu dan/atau dua berdasarkan masing-masing skenario. Gambar 4 mengilustrasikan
aliran model umum dari IBM SPSS Modeler.

5.5 Evaluasi peraturan


Setelah melakukan semua jenis skenario, kami mencatat hasilnya sebagai sejumlah aturan,
nomor cluster dan waktu yang telah berlalu. Pada saat itu, giliran NN yang menandakan segalanya
atribut-atribut penting yang mungkin mengambil peran sebagai faktor yang paling kuat
memperkirakan lima produk yang paling banyak terjual (produk 53, 65, 55, 11 dan 39). Gambar 5
mengilustrasikan aliran evaluasi berbasis NN. Persentase kepentingan variabel
menunjukkan bahwa penggunaan skenario tertentu memperkaya faktor lebih baik dibandingkan skenario lainnya. Untuk
Misalnya seperti terlihat pada Tabel VI, untuk skenario nomor 23 k-means clusternya lebih banyak
penting untuk meramalkan jumlah penjualan produk VAR00065.

5.6 Hasil analisis


Kumpulan data transaksi pelanggan di kehidupan nyata dievaluasi dengan algoritma yang diusulkan
untuk mencapai pola perilaku pembelian pelanggan terbaik dan ekstraksi
Machine Translated by Google

K
45,7

1146
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

Gambar 3.
Perbandingan
algoritma
pengelompokan k-
means dan Kohonen
yang
menargetkan
jumlah cluster dan waktu yang berlalu
Machine Translated by Google

aturan asosiasi. Untuk ini, rangkaian aliran yang berbeda dan beragam atribut diperiksa oleh Pelanggan sebagai jenis
skenario. Semua jenis 42 skenario diterapkan, dieksekusi, dan dievaluasi segmentasi oleh
komputer mikroprosesor
Intel Dual Core i7 dan semua hasil yang mungkin adalah pendekatan yang diuraikan dalam Tabel
IV. Tingkat klaster
pelanggan, dukungan, dan kepercayaan didasarkan pada RFM yang telah diatur sebelumnya
secara sama untuk
semua jenis skenario, namun, jumlah klaster dikurangi menjadi tiga atau dua dalam beberapa
skenario. Hal ini disebabkan oleh ketidakmampuan algoritma yang tertanam pada jenis skenario
tertentu sehingga tidak dapat melihat perbedaan saat menggunakan algoritma k-means clustering. 1147
Dalam jenis skenario yang berbeda, jumlah aturan bervariasi antara 329 dan 2.491 dan
diinginkan jumlah aturan yang lebih tinggi. Selain itu, waktu yang telah berlalu berkisar antara
tujuh hingga 223 menit dan diinginkan waktu yang lebih singkat. Berdasarkan evaluasi kami
karena skenario 25 memiliki aturan yang paling rinci dengan jumlah cluster yang paling tepat dan
waktu berlalu yang lebih singkat, skenario ini terbukti menjadi pilihan terbaik menurut metodologi
yang kami usulkan (yaitu kebersamaan faktor demografi dan RFM saat melakukan clustering,
dan penyebab-penyebabnya). aturan asosiasi yang lebih akurat).
Langkah perbandingan diselesaikan dengan menggunakan NN untuk memeriksa tingkat
efektivitas konten cluster untuk memprediksi lima produk teratas yang terjual. Semua tingkat
efektivitas untuk lima produk yang sangat direkomendasikan oleh algoritma asosiasi aturan telah
dicatat. Semua tingkat efektivitas yang tercatat ini dirata-ratakan dan diilustrasikan pada Tabel
V. Jenis skenario 23, 24 dan 25 memiliki rata-rata tingkat efektivitas yang lebih baik dengan
menggunakan NN. Rata-rata skenario tipe 25 jelas merupakan yang terbaik. Hasilnya, skenario
25 merupakan skenario terbaik setelah dilakukan perbandingan Tabel IV dan VI. Skenario (aliran)
25 menekankan algoritma dengan mengelompokkan pelanggan tidak hanya dengan data RFM
mereka tetapi dengan komposisi skor RFM dan data demografis. Lebih lanjut, jenis skenario ini
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

menunjukkan bahwa moneter merupakan faktor terpenting dalam pengelompokan hasil analisis
RFM.
Pada hasil ARM, skenario terbaik kami (no. 25) mengekstraksi 2.491 aturan. Aturan-aturan
tersebut berbentuk anteseden dan konsekuensi. Anteseden menunjukkan perbedaan faktor dan
perilaku pembelian pelanggan. Kami memiliki lima kelompok berbeda yang terdiri dari keluaran
analisis RFM dan data demografi. (Isi cluster ditunjukkan pada Tabel V.) Konsekuensinya
menunjukkan produk-produk yang telah dibeli oleh pelanggan dengan anteseden tersebut. Pada
Tabel V kami telah menunjukkan sebagian hasil aturan sebagai contoh, terutama untuk produk
yang paling banyak dibeli.

6. Pembandingan
Untuk meningkatkan kualitas pekerjaan, skenario ke-25 dari metodologi yang kami usulkan, yang
menyimpulkan penelitian ini sebagai jenis skenario terbaik, dibandingkan dengan pekerjaan
serupa yang telah dilakukan belakangan ini. Algoritme berbeda dari karya serupa diterapkan
pada kumpulan data kami. Hasil metodologi yang diusulkan dan hasil tolok ukurnya dirangkum
dalam Tabel VII.

Jumlah aturan Dukungan minimum % Keyakinan minimum % Waktu yang


berlalu (Min.)
Tabel III.

apriori 613 71 80,42 14 Perbandingan


Algoritma Eclat 439 42 75 32 algoritma penambangan
Algoritma aturan pertumbuhan
pertumbuhan FP 541 22 70 15 Apriori, Eclat dan FP
sreabthilm
suukrbe
d4ia6
ntn
v1
)hp
d1
ka
T
iu:e
n
a0
e1tP
4 is
lU
D
P
S
T
o(I
0
1
2

K
45,7

1148

berbeda
Gambar 4.
Model umum

kombinasi dari
aliran termasuk

masukan dan keluaran


Machine Translated by Google

..as.iskasantaarD
T isigneP 5102-10-90 gniraS
sineJ sisiM
laF
nRA

..as.iskasantaarD
T

gnad9ib
4 gniraS itrare-B
K gniraS itrare-B
K
sineJ sineJ
Machine Translated by Google

Pelanggan
segmentasi
Data Transaksi.sa.. Pengisi 09-01-2015 Saring
Jenis Analisis RFM
pendekatan
berdasarkan RFM

Data Transaksi.sa.. Menggabungkan


1149

49 bidang Saring
K-Berarti Saring K-Berarti
Jenis Jenis

Jenis Jenis Jenis Jenis Jenis

Gambar 5.
Aliran model
termasuk NN
VAR00053 VAR00065 VAR00055 VAR00011 VAR00039 aliran prediksi

Waktu Waktu Waktu


Skenario Gugus Aturan berlalu Skenario Gugus Aturan berlalu Skenario Gugus Aturan berlalu
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

(1-14) nomor nomor (menit) (15-28) nomor nomor (menit) (29-42) nomor nomor (menit)

1 5 647 127 15 5 517 10 29 2 522 22


2 5 763 119 16 5 517 11 30 5 329 24
3 5 547 113 17 5 517 14 31 5 1.653 27
4 5 547 15 18 5 517 13 32 5 1.747 25
5 5 1.647 220 19 5 517 14 33 5 1.062 25
6 5 1.647 223 20 5 517 15 34 5 1.060 24
7 5 1.647 112 21 5 517 15 35 3 1.056 23
8 5 1.555 35 22 5 517 7 36 4 517 22
9 5 1.555 34 23* 5 1.517 9 37 4 517 24
10 5 1.555 35 24* 5 1.517 8 38 4 517 22
11 5 1.555 31 25** 5 2.491 9 39 4 517 26
12 5 1.555 33 26 5 1.175 7 40 4 517 26
13 5 1.555 33 27 5 613 8 41 4 611 19 Tabel IV.
14 5 1.555 32 28 5 613 10 42 4 423 18 Hasil kinerja
dari skenario yang berbeda
Catatan: *Skenario yang lebih baik; **skenario terbaik

Dursun dan Caber (2016) berfokus pada pembuatan profil pelanggan hotel yang menguntungkan oleh RFM
analisis dalam pekerjaan mereka (Dursun dan Caber, 2016). Mereka menggunakan RFM ekuiponderansi
skor (WR ¼ WF ¼ WM). Kami menggunakan pendekatan mereka yang sama dengan kami
digunakan untuk fase segmentasi skenario kedelapan kami. Ghodousi dkk. (2016) berkumpul
kumpulan informasi dari distrik kota di suatu kota dan menganalisisnya untuk memprioritaskan perkotaan
kebutuhan yang dinilai untuk kepuasan warga (Ghodousi et al., 2016). Secara keseluruhan,
43 kebutuhan warga diidentifikasi dan dikategorikan menggunakan k-means clustering dan fuzzy
metode pengelompokan berdasarkan nilai RFM berbobot sama (WR ¼ WF ¼ WM) . Margianti
dkk. (2016) menggunakan pengelompokan dengan propagasi afinitas dan model RFM pada 1.000
Machine Translated by Google

K data pelanggan dalam penelitian mereka. Mereka menggunakan metode afinitas jarak
algoritma propagasi dengan dua jarak Euclidean dan jarak Manhattan
45,7
teknik untuk memudahkan analisis perusahaan terhadap data transaksi pelanggan (Margianti
dkk., 2016; Nazari dan Ersoy, 1992).
Jelas bahwa waktu yang berlalu (sembilan menit), menjadi faktor efektivitas pengelompokan
level (0,284) dan jumlah aturan (2,491) untuk metode yang kami usulkan, berhasil
1150 tidak dapat disangkal lebih baik dibandingkan pendekatan lain. Gambar 6 menyajikan hasil clustering
kinerja secara grafis, mengadopsi algoritme tolok ukur untuk kumpulan data kami
menggunakan program MATLAB.

7. Implikasi
Metode pemasaran modern menggunakan berbagai kriteria untuk mengelompokkan klien dan kampanye bertarget
dan pesan publisitas untuk produk dan layanan (Nettleton, 2014). Memperoleh
informasi tentang karakteristik pelanggan, dan menganalisis yang dicatat sebelumnya
data untuk menghasilkan aturan asosiasi dan strategi CRM, telah menjadi hal yang penting
perusahaan akibat persaingan global. Analisis DM memungkinkan manajer untuk menemukan
permintaan potensial pelanggan sasaran dengan mengamati perilaku mereka di masa lalu.
Penelitian saat ini menekankan pengelompokan, yang merupakan alat DM yang sangat berguna untuk mengurangi
kompleksitas kumpulan data transaksional yang sangat besar. Di jalan ini, akurasi pengelompokan
merupakan faktor penting lainnya yang mempengaruhi efektivitas peraturan asosiasi
secara langsung. Untuk mencapai tingkat akurasi cluster yang dapat diterima, analisis RFM, khususnya,
telah menambahkan faktor tambahan pada analisis pengelompokan pelanggan. Sebagai pengelompokan pelanggan
tingkat efektivitas sangat penting, seseorang mungkin perlu memiliki lebih banyak atribut untuk membuatnya
cluster yang dihasilkan diperkaya mungkin. Data demografi dari pelanggan adalah
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

mudah digunakan dan faktor penting yang mudah diakses oleh perusahaan.
Menariknya, data demografis dari pelanggan meningkatkan kinerja klaster.
tingkat efektivitas dan kualitas aturan yang diekstraksi ketika data ini diintegrasikan
dengan faktor skor RFM.
Secara umum, perusahaan telah menggunakan aturan asosiasi ini untuk membuat penawaran dan
kampanye yang disesuaikan untuk pelanggan mereka saat ini atau calon pelanggan (yang dikenal sebagai
“gamifikasi”). Penawaran atau pesan yang tidak relevan dan salah yang dikirim terlalu sering ke pelanggan akan terjadi
mengurangi kesan yang dibuat oleh kampanye, menyebabkan kerugian finansial dan pelanggan. Oleh
menggunakan metodologi yang diusulkan untuk pengelompokan pelanggan dan dengan konsekuensi ARM,
pesan yang relevan dan benar dapat disampaikan kepada sasaran pelanggan dengan lebih luas
percaya diri dan lebih presisi.

Akibat
Aturan Mendahului (produk) Dukungan % Keyakinan %

Tabel V. Cluster ¼ 1, minuman 2 ¼ ya, pizza 3 ¼ ya Var00053 ¼ ya 1 2 Cluster ¼ 2, 89,8 99.9


Menjadi signifikan minuman 23 ¼ ya, pizza 11 ¼ ya Var00065 ¼ ya Cluster ¼ 5, minuman 11 ¼ ya, 83,0 98.7
aturan untuk diidentifikasi pizza 2 ¼ ya Var00055 ¼ ya 3 4 Cluster ¼ 5, minuman 7 ¼ ya, pizza 8 ¼ ya 82,11 97.1
produk tertentu Var00011 ¼ ya Cluster ¼ 4, minuman 7 ¼ ya, pizza 2 ¼ ya Var00039 ¼ ya 5 Cluster 69,21 99.2
konsumen dari 1 ¼ (skor R ¼ 4, skor F ¼ 1, M skor ¼ 1, Kota ¼ 5, Jenis Kelamin Kucing ¼ 70,43 80.42
skenario no. 25, 2, Umur Kucing ¼ 2)
mana yang terbaik Cluster 2 ¼ (skor R ¼ 5, skor F ¼ 2, skor M ¼ 2, Kota ¼ 62, Jenis Kelamin Kucing. ¼ 1, Usia Kucing. ¼ 3)
skenario (dari Cluster 5 ¼ (skor R ¼ 5, skor F ¼ 2, skor M ¼ 2, Kota ¼ 12, Jenis Kelamin Kucing. ¼ 1, Usia Kucing. ¼ 3)
di antara 2.491 Cluster 5 ¼ (skor R ¼ 5, skor F ¼ 2, skor M ¼ 2, Kota ¼ 1, Jenis Kelamin Kucing. ¼ 2, Usia Kucing. ¼ 1)
sampel) Cluster 4 ¼ (skor R ¼ 5, skor F ¼ 2, skor M ¼ 2, Kota ¼ 43, Jenis Kelamin Kucing. ¼ 2, Usia Kucing. ¼ 3)
Machine Translated by Google

Efektivitas Efektivitas Efektivitas Efektivitas Efektivitas


Pelanggan
Rata-rata dari
tingkat untuk tingkat untuk tingkat untuk tingkat untuk tingkat untuk efektivitas segmentasi
Skenario produk 0065 produk 0055 produk 0011 produk 0039 produk 0053 tingkat
pendekatan
0,0447 0,0465 0,0597 0,1123 0,0903 0,0707 berdasarkan RFM
1 0,0601 0,047 0,0632 0,0489 0,0865 0,06114
2 0,016 0,1319 0,0449 0,0772 0,0357 0,06114
3 0,00402 0,0218 0,0218 0,0202 0,0176 0,017084
1151
4 0,0132 0,0906 0,0494 0,00137 0,00121 0,031156
5 0,0097 0,0188 0,0315 0,032 0,018 0,022
6 0,0449 0,0215 0,0284 0,0307 0,02344 0,029788
7 0,0056 0,0307 0,035 0,0615 0,0519 0,03694
8 0,00899 0,0466 0,0186 0,0349 0,0447 0,030758
9 0,00148 0,0187 0,0373 0,0429 0,0467 0,029416
10 0,000817 0,0245 0,0337 0,0381 0,036 0,0266234
11 0,00192 0,016 0,0278 0,035 0,0504 0,026224
12 0,024 0,028 0,0265 0,0468 0,0477 0,0346
13 0,00374 0,0522 0,0448 0,03 0,0393 0,034008
14 0,0266 0,0144 0,0301 0,0146 0,0242 0,02198
15 0,0144 0,0286 0,021 0,0232 0,0186 0,02116
16 0,01 84 0,0264 0,0267 0,0126 0,0165 0,02012
17 0,0186 0,019 0,02 92 0,020 0. 0353 0,02458
18 0,062 2 0,0133 6 0,0248 0,04566
19 0,0915 0,098 0,0233 0,0302 0,0254 0,03996
20 0,0122 0,026 0,0281 0,0336 0,0218 0,0194
21 0,0306 0,0107 0,0165 0,0242 0,0253 0,02754
22 0,408 0,0379 0,0129 0,0274 0,195 0,13398
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

23* 0,143 0,0319 0,0145 0,0221 0,424 0,12856


24* 0,148 0,0306 0,177 0,0307 0,284 0,13672
0,003 0,0452 0,00771 0,0294 0,0239 0,013722
0,00554 0,0218 0,00137 0,0122 0,0242 0,019002
0,00162 0,0299 0,0197 0,034 0,0289 0,020344
0,021 0,0331 0,0528 0,0184 0,0124 0,018718
0,00158 0,00119 0,0478 0,0062 0,0588 0,035616
0,036 0,0232 0,0379 0,0467 0,135 0,0544
0,0413 0,0389 0,0326 0,0242 0,1058 0,06242
0,0116 0,113 0,0307 0,0194 0,061 0,02946
0,0197 0,0222 0,0254 0,0218 0,0147 0,02248
0,068 0,0228 0,017 0,0298 0,115 0,04672
1 0,0117 0 0,0218 0,021 0,029604 Tabel VI.
0,0633 0,02 0,0319 0,0 9 0,019244 Hasil analisa dari
0,00172 25 0,0145 0842 0,02 0,0292 pengayaan cluster
0,0494 0,0281 0,0347 0,0319 0,0154 0,01752 tingkat (efektivitas
0,0136 0,0115 0,011 0,035 0,014 0,01916 level) menggunakan NN untuk
0,0201 0,0262 0,0228 0,0148 0,0185 lima yang paling banyak terjual

0,0246
25** 26 27 28 29 30 0,0213
31 32 33 34 35 36 370,0137 0,016
38 39 40 41 420,0173
0,0312 0,01 0,01970,016 0,0248 0,0226
0,0171 0,0183 0,01984 produk

8. Kesimpulan
Bisnis selalu berusaha mendapatkan metode yang dapat dipercaya dan nyaman
ekstraksi aturan asosiasi menggunakan data transaksi pelanggan untuk mendapatkan kualitas yang lebih baik
dari CRM. Mereka terdorong untuk mencoba mengenali kebutuhan masyarakat dan kebutuhan mereka
pelanggan dengan lebih tepatnya. Jadi, untuk membedakan kebutuhan massa pelanggannya
dan menciptakan interaksi yang bermakna antara produsen dan konsumen
Machine Translated by Google

K
Segmentasi Nomor Nomor Tingkat efektivitas Berlalu
45,7 mendekati Alat pengelompokan cluster aturan untuk produk Var.53 waktu

Dursun (skor RFM) K-berarti 5 1.555 0,0519 35


dan Caber WR¼ WF ¼ WM
(2016)
1152 Ghodousi (nilai RFM) K-berarti 5 517 0,0465 127
dkk. (2016) WR¼ WF ¼ WM
Fuzzy K-berarti 16+ 1.240 0,195 215
Margianti (nilai RFM) Propagasi afinitas – 4 1.804 0,0097 9.8
dkk. (2016) WR¼ WF ¼ WM Jarak Euclidean
Propagasi afinitas – 5 1.625 0,0307 7.7
Tabel VII. Jarak Manhattan
Diringkas Diajukan skor RFM K-berarti 5 2.491 0,284 9
pembandingan skenario +demografis
hasil data

melakukan upaya untuk memahami pelanggan melalui perilaku dan transaksi mereka. Untuk mencapai
ini, mereka harus memilah sejumlah besar data pelanggan mereka untuk mengidentifikasi di mana
untuk menemukan keunggulan kompetitif. Dalam hal ini, kami telah berusaha untuk memeriksa jenis yang terbaik
pendekatan segmentasi pelanggan yang didasarkan pada RFM dan atribut demografi.
Menantang dampak RFM dan atribut demografi untuk memperkaya pelanggan
segmen adalah hasil dari pengelompokan faktor, dan ekstraksi yang lebih dapat diandalkan
aturan asosiasi adalah tujuan utama dari penelitian ini.
Dalam penelitian ini kami menggunakan data transaksi dari jaringan restoran pizza global hingga
mengevaluasi kinerja aturan yang diekstraksi. Sebagai bagian dari evaluasi ini, dampak dari
atribut demografis untuk memperkaya faktor segmentasi pelanggan telah
tertantang. Berbagai jenis skenario telah dirancang, dilaksanakan dan dievaluasi
cermat dalam kondisi pengujian yang seragam. Metodologi yang efektif berdasarkan a
tahap desain skenario yang komprehensif diresmikan. Hasilnya dievaluasi
dan dibandingkan menggunakan teknik pembelajaran mesin yang efisien. Semua hasil tesnya adalah
dicatat dan diringkas. Penelitian ini menunjukkan bahwa bobot atribut RFM
mempengaruhi kinerja asosiasi aturan secara positif. Apalagi untuk mendapatkan hasil yang lebih akurat
segmen pelanggan, kombinasi atribut WRFM dan demografis
e
iu:en
T
ka
d1
)hp islU
1tP
a0
4 D
P
S
T
o(I
0
1
2

direkomendasikan. Oleh karena itu, metodologi yang diusulkan menghasilkan hasil terbaik
suukrbe
sreabthilm ntnv1
d4ia6

dan skor, sehingga pentingnya WRFM dan data demografi dalam cluster
telah terbukti. Meskipun kami telah menggunakan data demografi dalam jumlah terbatas
atribut, analisis hasil menunjukkan pentingnya demografi yang tidak dapat disangkal
faktor digabungkan dengan data RFM. Menggunakan aturan yang lebih akurat dan kuat, pemasaran
manajer dapat menyiapkan kampanye yang lebih bertarget dan efektif berdasarkan
segmen pelanggan yang akurat. Untuk penelitian selanjutnya, menggunakan cakupan yang diperluas
atribut, kami akan menggunakan data firmografi dan perilaku pelanggan dalam fase tersebut
pengayaan masukan. Apalagi dalam tahap penyelesaian, mempertimbangkan mesin baru
konsep pembelajaran akan memainkan peran yang lebih besar dalam menggabungkan pengelompokan dan aturan yang berbeda
teknik ekstraksi. Dengan demikian, metodologi yang ada saat ini akan ditingkatkan dengan menggunakan
pengelompokan metaheuristik dan algoritma aturan asosiasi yang dapat meningkatkan pelatihan
kecepatan, waktu yang berlalu, dan kemampuan alat DM untuk mengekstrak lebih kuat dan lebih banyak lagi
aturan yang komprehensif.
sreabthilm
suukrbe
d4ia6
ntn
v1
)hp
d1
ka
T
u
i:e
n
a0
e1tP
4 islU
D
P
S
T
o(I
0
1
2

naedkilacruaE
J nattahkn
araaMJ
Machine Translated by Google

51 51

01 01

5 5

0 0


4 –
4
– – 0 2 4 6 8 – – 0 2 4 6 8
nakanugsg
n
)M
in
aeF
li-n
m
R
K( synlziaszeau-m
H
K
F
51 01

8
01
6
5 4
2
0
0

4 –
4
– – 0 2 4 6 8 – – 0 2 4 6 8
segmentasi

teknik
pendekatan

1153

tolok ukur
Pelanggan

Keluaran grafis dari


pengelompokan menggunakan
Gambar 6.
berdasarkan RFM
Machine Translated by Google

K Referensi
45,7 Agrawal, R. dan Srikant, R. (1994), “Algoritma cepat untuk aturan asosiasi penambangan dalam
database besar”, dalam VLDB '94: Prosiding Konferensi Internasional ke-20 tentang Basis
Data Sangat Besar, Morgan Kaufmann, hal. 487-499 .
Agrawal, R., Imielinski, T. dan Swami, A. (1993), “Aturan asosiasi penambangan antara kumpulan item
dalam database besar”, ACM SIGMOD Record, Vol. 22, Mei, hlm. 207-216, tersedia di: http://
1154 doi.org/ 10.1145/170036.170072.

Agrawal, R., Mannila, H., Srikant, R., Toivonen, H. dan Verkamo, A. (1996), “Penemuan cepat aturan
asosiasi”, dalam Usama, RU, Fayyad, M., Piatetsky-Shapiro, G. dan Smyth, P. (Eds),
Memajukan Penemuan Pengetahuan dan Penambangan Data, Vol. 12, AAAI, hal. 307-328,
tersedia di: www.cs.helsinki.fi/hannu.toivonen/pubs/advances.pdf
Ambler, T., Bhattacharya, CB, Edell, J., Keller, KL, Lemon, KN dan Mittal, V. (2002), “Menghubungkan
perspektif merek dan pelanggan pada manajemen pemasaran”, Journal of Service Research,
Vol. 5 No.1, hal.13-25, doi: 10.1177/1094670502005001003.
Bayardo, RJ (1998), “Menambang pola panjang dari database secara efisien”, ACM SIGMOD Record,
Jil. 27 No.2, hal.85-93, doi: 10.1145/276305.276313.
Birant, D. (2003), “Aplikasi berorientasi pengetahuan dalam penambangan data”, dalam Funatsu, D.
(Ed.), Aplikasi Berorientasi Pengetahuan dalam Penambangan Data, InTech Published,
Shanghai, hal. 91-108.
Blattberg, RC, Kim, B.-D. dan Neslin, SA (2008), Pemasaran Basis Data: Menganalisis dan Mengelola
Pelanggan, Springer, New York.
Brin, S., Motwani, R. dan Silverstein, C. (1997), “Melampaui keranjang pasar: menggeneralisasi
aturan asosiasi menjadi korelasi”, ACM SIGMOD Record, Vol. 26 No.2, hal.265-276, doi:
10.1145/ 253262.253327.
Chan, CCH (2008), “Metode segmentasi pelanggan berbasis nilai cerdas untuk manajemen
kampanye: studi kasus pengecer mobil”, Sistem Pakar dengan Aplikasi, Vol. 34 No.
4, hal. 2754-2762, doi: 10.1016/j.eswa.2007.05.043.
Chen, Y.-L., Kuo, M.-H., Wu, S.-Y. dan Tang, K. (2009), “Menemukan pola sekuensial terkini,
frekuensi, dan moneter (RFM) dari data pembelian pelanggan”, Penelitian dan Aplikasi
Perdagangan Elektronik, Vol. 8 No. 5, hal. 241-251, doi: 10.1016/j.elerap.2009.03.002.
Cheng, CH dan Chen, YS (2009), “Mengklasifikasikan segmentasi nilai pelanggan melalui model
RFM dan teori RS”, Sistem Pakar dengan Aplikasi, Vol. 36 No.3/Bagian 1, hal.4176-4184,
doi: 10.1016/j.eswa.2008.04.003.
Chung, Y.-C. dan Chen, S.-J. (2016), “Studi tentang aktivitas manajemen hubungan pelanggan
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 ilsU
1tP D
P
S
T
o(I
0
1
2

di pabrik pariwisata Taiwan”, Total Quality Management & Business Excellence, Vol. 27
Nos 5-6, hal. 581-594, doi: 10.1080/14783363.2015.1019341.
Claycamp, HJ dan William, FM (1968), “Teori segmentasi pasar”, Jurnal Pemasaran
Penelitian, Jil. 5, hal.388-394.
Coussement, K., Van den Bossche, FAM dan De Bock, KW (2014), “Dampak akurasi data
terhadap kinerja segmentasi: analisis RFM benchmarking, regresi logistik, dan pohon
keputusan”, Journal of Business Research, Vol. 67 No. 1, hal. 2751-2758, doi: 10.1016/
j. jbusres.2012.09.024.
Demartines, P. dan Blayo, F. (1992), “Peta pengorganisasian mandiri Kohonen: apakah normalisasi
diperlukan?”, Sistem Kompleks, Vol. 6 No.2, hal.105-123.
Dursun, A. dan Caber, M. (2016), “Menggunakan teknik penambangan data untuk membuat profil
pelanggan hotel yang menguntungkan: penerapan analisis RFM”, Perspektif Manajemen
Pariwisata, Vol. 18, Mei, hlm. 153-160, tersedia di: http://doi.org/10.1016/j.tmp.2016.03.001
Machine Translated by Google

Fallis, A. (2013), Konsep dan Teknik Data Mining. Jurnal Informasi dan Pemodelan Kimia, Vol. 53, Pendekatan
Elsevier, hal. 1689-1699, tersedia di: http://doi.org/10.1017/ CBO9781107415324.004
segmentasi
pelanggan
Ghodousi, M., Alesheikh, AA dan Saeidian, B. (2016), “Menganalisis data peserta publik
berdasarkan RFM mengevaluasi
kepuasan warga dan memprioritaskan kebutuhan mereka melalui K-means, FCM, dan
ICA”, Cities, Jil. 55 No. 1, hal. 70-81, tersedia di: http://doi.org/10.1016/
j.cities.2016.03.015 Han, JHJ, Dong, GDG dan Yin, YYY (1999), “Penambangan yang efisien 1155
pola periodik parsial dalam database deret waktu”, Prosiding Konferensi Internasional
ke-15 tentang Rekayasa Data (Kat. No. 99CB36337), hal. 1-10, doi: 10.1109/ICDE.1999.754913.
Hiziroglu, A. (2013), “Aplikasi komputasi lunak dalam segmentasi pelanggan: tinjauan dan kritik canggih”,
Sistem Pakar dengan Aplikasi, Vol. 40 No. 16, hal. 6491-6507, doi: 10.1016/ j.eswa.2013.05.052.

Hosseini, ZZ dan Mohammadzadeh, M. (2016), “Penemuan pengetahuan dari perilaku pasien melalui
algoritma klasifikasi pengelompokan berdasarkan model eRFM dan CLV berbobot: studi empiris
dalam layanan perawatan kesehatan masyarakat”, Jurnal Penelitian Farmasi Iran, Vol. 15 No.1,
hal.355-367.
Hu, YH dan Yeh, TW (2014), “Menemukan pola frekuensi yang berharga berdasarkan analisis RFM
tanpa informasi identifikasi pelanggan”, Sistem Berbasis Pengetahuan, Vol. 61 No. 3, hal. 76-88,
tersedia di: http://doi.org/10.1016/j.knosys.2014.02.009 Hughes, AM
(1994), Strategic Database Marketing, Probus Publishing Company, Chicago.
Kahan, R. (1998), “Menggunakan teknik pemasaran database untuk meningkatkan inisiatif pemasaran
satu-ke-satu Anda”, Jurnal Pemasaran Konsumen, Vol. 15 No.5, hal.491-493, doi: 10.1108/
07363769810235965.
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

Khajvand, M., Zolfaghar, K., Ashoori, S. dan Alizadeh, S. (2011), “Memperkirakan nilai seumur hidup
pelanggan berdasarkan analisis RFM perilaku pembelian pelanggan: studi kasus”, Procedia
Computer Science, Vol . 3 No. 1, hal. 57-63, tersedia di: http://doi.org/10.1016/
j.procs.2010.12.011 McCarty, JA dan Hastak, M. (2007), “Pendekatan segmentasi dalam penambangan
data : perbandingan RFM, CHAID, dan regresi logistik”, Jurnal Riset Bisnis, Vol. 60 No. 6, hal.
656-662, doi: 10.1016/j.jbusres.2006.06.015.
Mannila, H., Toivonen, H. dan Verkamo, AI (1994), “Algoritma yang efisien untuk menemukan aturan
asosiasi”, Lokakarya AAAI tentang Penemuan Pengetahuan di Database KDD94, Vol. 118 Nos
1-4, hal. 181-192, tersedia di: http://ukpmc.ac.uk/abstract/CIT/21659.
Mannila, H., Toivonen, H. dan Verkamo, AI (1997), “Penemuan episode yang sering terjadi dalam
rangkaian peristiwa”, Data Mining dan Penemuan Pengetahuan, Vol. 1 No.3, hal.259-290, doi:
10.1023/ A:1009748302351.
Marcus, C. (1998), “Pendekatan praktis namun bermakna terhadap segmentasi pelanggan”, Jurnal
Pemasaran Konsumen, Vol. 15 No.5, hal.494-504, doi: 10.1108/07363769810235974.
Margianti, ES, Refianti, R., Mutiara, AB, Nuzulina, K., Teknologi, I. dan Teknologi, I. (2016), “Propagasi
afinitas dan model RFM untuk analisis data CRM”, Jurnal Informasi Teoritis dan Terapan
Teknologi, Jil. 84 No.2, hal.272-282.
Namvar, M., Gholamian, MR dan Khakabi, S. (2009), “Pemilihan model bisnis elektronik berdasarkan
modal intelektual perusahaan”, Konferensi Internasional ke-8 tentang E-Bisnis, hal.132-140.
Nazari, J. dan Ersoy, OK (1992), “Implementasi teknik kelistrikan dan komputer dari jaringan saraf
propagasi balik dengan MatLab, Laporan Teknis ECE, Makalah 275, tersedia di: http://
docs.lib.purdue.edu/ecetr /275.
Nettleton, D. (2014), “Bab 13 – CRM – manajemen dan analisis hubungan pelanggan”, dalam Dierna, A.
(Ed.), Commercial Data Mining, hal. 195-208, Morgan Kaufmann, Waltham, MA, tersedia di :
http://doi.org/10.1016/B978-0-12-416602-8.00013-3
Machine Translated by Google

K Ngai, EWT, Xiu, L. dan Chau, DCK (2009), “Penerapan teknik data mining dalam
manajemen hubungan pelanggan: tinjauan literatur dan klasifikasi”, Sistem Pakar
45,7 dengan Aplikasi, Vol. 36 No.2, hal.2592-2602, doi: 10.1016/j.eswa.2008.02.021.
Nichol, MB, Knight, TK, Dow, T., Wygant, G., Borok, G., Hauch, O. dan O'Connor, R. (2008),
“Algoritma cepat untuk aturan asosiasi pertambangan”, The Annals of Farmakoterapi, Jil.
42 No.1, hal.62-70, doi: 10.1.1.40.7506.
1156 Pakhira, MK, Bandyopadhyay, S. dan Maulik, U. (2004), “Indeks validitas crisp dan fuzzy
cluster”, Pengenalan Pola, Vol. 37, hal.487-501.
Power, C. dan Elliott, J. (2006), “Profil kelompok: kelompok kelahiran Inggris 1958 (studi perkembangan
anak nasional)”, Jurnal Internasional Epidemiologi, Vol. 35 No. 1, hal. 34-41, doi: 10.1093/ije/dyi183.
Razieh, Q., Baqeri-Dehnavi, M., Minaei-Bidgoli, B. dan Amooee, G. (2012), “Mengembangkan
model untuk mengukur loyalitas dan nilai pelanggan dengan teknik RFM dan algoritma
clustering”, Jurnal Matematika dan Ilmu Komputer, Jil. 4 No. 2, hal. 172-181, tersedia
di: www.tjmcs.com
Ryder, NB (1965), “Kohort sebagai konsep dalam studi perubahan sosial”, American Sociological
Reviewl Review, Vol. 30 No. 6, hal. 843-861, tersedia di: http://doi.org/10.2307/2090964
Silverstein, C., Ullman, J., Brin, S. dan Motwani, R. (1998), “Teknik skalabel untuk menambang
struktur sebab akibat”, Data Mining dan Knowledge Discovery, Vol. 24 No.146, hal.594-605.
Smith, WR (1956), “Diferensiasi produk dan segmentasi pasar sebagai alternatif
strategi pemasaran”, Jurnal Pemasaran, Vol. 21, hal.3-8.
Soltani, Z. dan Navimipour, NJ (2016), “Mekanisme manajemen hubungan pelanggan: tinjauan
sistematis literatur mutakhir dan rekomendasi untuk penelitian masa depan”, Komputer
dalam Perilaku Manusia, Vol. 61 No. 1, hal. 667-688, tersedia di: http://doi.org/10.1016/
j.chb.2016.03.008
Stone, B. (1995), Metode Pemasaran Langsung yang Sukses, Buku Bisnis NTC, Lincolnwood, IL,
hal.37-57.
Teichert, S. (2008), “Dampak amonium menyerap mepA, mepB, dan mepC pada
metabolisme sekunder yang diatur nitrogen di Fusarium fujikuroi”, Sel Eukaryot, Vol.
7 No.2, hal.187-201.
Ultsch, A. dan Siemon, HP (1990), “Peta fitur pengorganisasian mandiri Kohonen untuk analisis
data eksplorasi”, Prosiding Konferensi Jaringan Syaraf Internasional (INNC-90), hlm. 305-308.
Vesanto, J. dan Alhoniemi, E. (2000), “Pengelompokan peta yang mengatur dirinya sendiri”, Transaksi
IEEE di Jaringan Syaraf Tiruan, Vol. 11 No.3, hal.586-600, doi: 10.1109/72.846731.
Wu, X., Kumar, V., Ross, QJ, Ghosh, J., Yang, Q., Motoda, H., y Steinberg, D. (2008), “10 algoritma
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 ilsU
1tP D
P
S
T
o(I
0
1
2

teratas dalam penambangan data”, Pengetahuan dan Informasi Sistem, Jil. 14 No. 1, hal.
1-37, tersedia di: http://doi.org/10.1007/s10115-007-0114-2
Xu, L. dan Chu, H. (2015), “Analisis Big Data terhadap penyediaan layanan seluler cerdas
manajemen hubungan pelanggan dalam e-commerce.
Yu, H.-H., Chen, C.-H. dan Tseng, VS (2011), “Menambang pola yang muncul dari data deret waktu
dengan batasan kesenjangan waktu”, International Journal of Innovative Computing, Information
and Control, Vol. 7 No.9, hal.5515-5528.
Yusof, N. dan Kraak, M. (2015), “Menambang pola sekuensial profil angin multidimensi”,
GeoComputation, Dallas, Texas, hal.395-400.
Zaki, MJ, Parthasarathy, S., Ogihara, M. dan Wei, L. (1997), “Algoritma baru untuk penemuan cepat
aturan asosiasi”, Konferensi Internasional ke-3 tentang Penemuan Pengetahuan dan
Penambangan Data, hal. 283-286, tersedia di: http://citeseer.ist.psu.edu/viewdoc/summary?
doi=10. 1.1.42.5143
Machine Translated by Google

Bacaan lebih lanjut Pendekatan


Smith, W. (1995), “Diferensiasi produk dan segmentasi pasar sebagai alternatif”, Manajemen Pemasaran, Vol. 4 segmentasi
No.3, hal.63-65.
pelanggan
Tentang penulis Peiman berdasarkan RFM
Alipour Sarvari adalah Kandidat PhD yang meneliti Teknik Industri di Universitas Teknik Istanbul. Ia lulus dengan
gelar MS dari Universitas Gazi pada tahun 2013. Bidang minatnya saat ini meliputi penambangan data,
1157
manajemen rantai pasokan, dan logistik.
Alp Ustundag lahir pada tahun 1977. Beliau lulus dari Departemen Teknik Industri Universitas Teknik Istanbul
(ITU) pada tahun 2000. Beliau menerima gelar MBA dari Universitas Boÿaziçi pada tahun 2002 dan gelar Doktor
dari ITU pada tahun 2008. Beliau melakukan studi penelitian di Departemen Logistik Universitas Dortmund,
Jerman, pada tahun 2007. Beliau menjadi Associate Professor di ITU pada tahun 2011. Saat ini beliau menjabat
sebagai Kepala Laboratorium Penelitian dan Pengujian Identifikasi Frekuensi Radio (RFID) di ITU. Dia telah
melakukan penelitian besar dan proyek konsultasi di bidang rekayasa ulang, logistik, dan manajemen rantai
pasokan untuk perusahaan-perusahaan besar Turki. Minat penelitiannya saat ini meliputi RFID, manajemen
rantai pasokan dan logistik, manajemen inovasi dan teknologi, manajemen risiko, sistem IT/IS, komputasi lunak
dan optimalisasi. Ia telah menerbitkan banyak makalah di jurnal internasional dan mempresentasikan berbagai
penelitian di konferensi nasional dan internasional. Alp Ustundag adalah penulis koresponden dan dapat
dihubungi di: ustundaga@itu.edu.tr

Hidayet Takci adalah Akademisi di Universitas Cumhuriyet, Sivas, Turki. Dia telah bekerja di berbagai bidang
seperti penambangan data, penambangan teks, pembelajaran mesin, dan keamanan. Hingga saat ini, beliau
juga mengajar mata kuliah penambangan data dan aplikasi, penambangan teks, jaringan syaraf tiruan, dan lain-lain.
Dia telah berkontribusi pada banyak makalah dan proyek di bidang penambangan data, penambangan teks,
pengambilan informasi, dan keamanan web.
d4ia6
suukrbe
sreabthilm d1
)hp
ntnv1 a0
e
Tiu:en
ka 4 islU
1tP D
P
S
T
o(I
0
1
2

Untuk instruksi tentang cara memesan cetak ulang artikel ini, silakan kunjungi situs web kami:
www.emeraldgrouppublishing.com/licensing/reprints.htm Atau hubungi kami
untuk rincian lebih lanjut: izin@emeraldinsight.com

Lihat statistik publikasi

Anda mungkin juga menyukai