Anda di halaman 1dari 69

UNIVERSITAS INDONESIA

Model Prediksi Pelanggan Churn bagi Penyedia Jasa Layanan Telekomunikasi


di Indonesia

TESIS

ETANO GARDA ARIYAN


1706130954

FAKULTAS ILMU EKONOMI DAN BISNIS


PROGRAM PASCASARJANA ILMU MANAJEMEN
KEKHUSUSAN MANAJEMEN PEMASARAN
DEPOK
2020
UNIVERSITAS INDONESIA

Model Prediksi Pelanggan Churn bagi Penyedia Jasa Layanan Telekomunikasi


di Indonesia

TESIS

Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister Science Management

ETANO GARDA ARIYAN


1806248652

FAKULTAS ILMU EKONOMI DAN BISNIS


PROGRAM PASCASARJANA ILMU MANAJEMEN
KEKHUSUSAN MANAJEMEN PEMASARAN
DEPOK
2020
HALAMAN PERNYATAAN ORISINALITAS

Tesis ini adalah hasil karya saya sendiri,


dan semua sumber baik yang dikutip mau pun dirujuk
telah saya nyatakan dengan benar.

Nama : Etano Garda Ariyan


NPM : 1706130954
Tanda Tangan :
Tanggal :
HALAMAN PENGESAHAN

Tesis ini diajukan oleh :


Nama : Etano Garda Ariyan
NPM : 1706130954
Program Studi : Program Pascasarjana Ilmu Manajemen
Judul Tesis : Model Prediksi Pelanggan Churn bagi Penyedia Jasa Layanan
Telekomunikasi di Indonesia

Telah berhasil dipertahankan di hadapan Dewan Penguji dan diterima sebagai bagian
persyaratan yang diperlukan untuk memperoleh gelar Magister Science Management pada
Program Studi Pascasarjana Ilmu Manajemen, Fakultas ekonomi dan Bisnis, Universitas
Indonesia.

DEWAN PENGUJI

Pembimbing : Sri Rahayu Hijarah Hati, SE., MSi., Ph.D. ( )

Ketua Penguji : Dr. Ir. Tengku Ezni Balqiah, M.E ( )

Anggota Penguji : Dr. Ignatius Heruwasto ( )

Ditetapkan di : Depok
Tanggal : 24 Juli 2020

i
UCAPAN TERIMA KASIH

Puji syukur saya panjatkan kepada Tuhan Yang Maha Esa, karena atas berkat dan
rahmat-
Nya, saya dapat menyelesaikan skripsi ini. Penulisan tesis ini dilakukan dalam rangka
memenuhi salah satu syarat untuk mencapai gelar Master of Science di Fakultas Ekonomi dan
Bisnis Jurusan Ilmu Manajemen Pemsaran. Saya menyadari bahwa, tanpa bantuan dan
bimbingan dari berbagai pihak, dari masa perkuliahan sampai pada penyusunan tesis
ini, sangatlah sulit bagi saya untuk menyelesaikan skripsi ini. Oleh karena itu, saya
mengucapkan terima kasih kepada:
(1) Ibu Sri Rahayu Hijrah Hati, Ph.D., selaku dosen pembimbing yang telah menyediakan waktu,
tenaga, dan pikiran untuk mengarahkan saya dalam penyusunan tesis ini;
(2) Pihak perusahaan telekomunikasi “X” yang telah banyak membantu dalam usaha
memperoleh data yang saya perlukan;
(3) orang tua dan keluarga saya yang telah memberikan bantuan dukungan material dan
moral; dan
(4) sahabat yang telah banyak membantu saya dalam menyelesaikan tesis ini.
Akhir kata, saya berharap Tuhan Yang Maha Esa berkenan membalas segala kebaikan
semua pihak yang telah membantu. Semoga tesis ini membawa manfaat bagi
pengembangan ilmu

Depok, __ 2020
Etano Garda Ariyan

ii
HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI TUGAS AKHIR UNTUK
KEPENTINGAN AKADEMIS

Sebagai sivitas akademik Universitas Indonesia, saya yang bertanda tangan di bawah ini:

Nama : Etano Garda Ariyan


NPM : 1706130954
Program Studi : Program Pascasarjana Ilmu Manajemen (PPIM)
Fakultas : Ekonomi dan Bisnis
Jenis Karya : Tesis

demi pengembangan ilmu pengetahuan, menyetujui untuk memberikan kepada Universitas


Indonesia Hak Bebas Royalti Noneksklusif (Non-exclusive Royalty-Free Right) atas karya
ilmiah saya yang berjudul:

Model Prediksi Pelanggan Churn bagi Penyedia Jasa Layanan Telekomunikasi di Indonesia

beserta perangkat yang ada (jika diperlukan). Dengan Hak Bebas Royalti Noneksklusif ini
Universitas Indonesia berhak menyimpan, mengaligmedia/format-kan, mengelola dalam bentuk
pangkalan data (database), merawat, dan mempublikasikan tugas akhir saya selama tetap
mencantumkan nama saya sebagai penulis/ pencipta, dan sebagai pemeilik Hak Cipta.

Demikian pernyataan ini saya buat dengan sebenarnya.


Dibuat di: Depok
Pada tanggal: ___ 2020
Yang menyatakan

(Etano Garda Ariyan)

iii
ABSTRAK

Nama : Etano Garda Ariyan


Program Studi : Program Pascasarjana Ilmu Manajemen
Judul : Model Prediksi Pelanggan Churn bagi Penyedia Jasa Layanan
Telekomunikasi di Indonesia

Selama beberapa tahun terakhir, margin laba operasi dari operator jasa layanan telekomunikasi di
Indonesia semakin berkurang. Situasi ini dominan dipicu oleh perang harga agresif yang
dilakukan oleh semua operator untuk mendapatkan pelanggan baru. Oleh karena itu, suatu
customer churn prediction modelling diperlukan untuk memetakan pelanggan dengan lebih baik
agar strategi program retensi pelanggan dapat dieksekusi seefisien mungkin tanpa mengorbankan
efektivitasnya. Penelitian ini bertujuan untuk memperoleh bukti empiris dan membangun
customer churn prediction modelling dari berbagai faktor independen yang secara langsung
maupun tidak langsung mempengaruhi pengambilan keputusan pelanggan untuk churn atau
bertahan di sebuah operator jasa layanan telekomunikasi tertentu. Data penelitian yang
digunakan fokus untuk memanfaatkan data sekunder dari penggunaan, perilaku, dan data
demografis pelanggan dari sebuah operator jasa layanan telekomunikasi. Sampel diuji
menggunakan analisis regresi logistik untuk melatih dan menghasilkan customer churn
prediction modelling akhir yang relevan dengan karakteristik pelanggan telekomunikasi saat ini.

iv
ABSTRACT

Author : Etano Garda Ariyan


Program : Program Pascasarjana Ilmu Manajemen
Title : Customer Churn Prediction Modelling for Telecommunication
Company in Indonesia

For several years, the operating profit margin of telecommunication operator in Indonesia have
been diminished. The situation is mainly triggered by aggressive price war deployed by all
operators to acquire new customers. Hence, the customer churn prediction modelling is needed
to map customer better and make the retention program strategy as efficient as possible yet
without comprimising its effectiveness. This research aims to obtain empirical evidence and
build customer churn prediction modelling from various independent factors that possibly affect
the decision making of customer to churn or retain at certain telecommunication provider in
Indonesia. The research data are mainly focus in utilizing secondary data of real customer’s
usage, behaviour, and demographic data from a telecommunication company. The samples were
tested using logistic regression analysis to train and produce final churn prediction model which
relevant to current customer’s characteristic at telecommunication industry.

v
DAFTAR ISI

HALAMAN PENGESAHAN
UCAPAN TERIMA KASIHi
HALAMAN PENYERTAAN PUBLIKASIii
ABSTRAKv
ABSTRACT.......................................................................................................................v
DAFTAR ISI
DAFTAR GAMBAR
DAFTAR TABEL
BAB 1
PENDAHULUAN
1.1 Latar Belakang
1.2 Rumusan Masalah
1.3 Tujuan Penelitian
1.4 Signifikansi Penelitian
1.4 Sistmatika Penulisan
BAB 2
LANDASAN TEORI
2.1 Faktor yang Mempengaruhi Customer Churn
2.2 Data yang Digunakan di Dalam Customer Churn Prediction Modelling
2.3 Pengaruh Karakteristik Demografis terhadap Customer Churn
2.4 Pengaruh Customer Satisfaction terhadap Customer Churn
2.5 Pengaruh Switching Cost terhadap Customer Churn
2.6 Pengaruh Customer Loyalty terhadap Customer Churn
2.7 Pengaruh Perilaku (Behavior) terhadap Customer Churn
2.8 Jenis Metodologi untuk Membentuk Customer Churn Prediction Modelling
2.9 Limitasi Customer Churn Prediction Modelling di Sektor Telekomunikasi
BAB 3
METODE PENELITIAN
3.1 Jenis Metodologi Penelitian
3.2 Rancangan dan Pendekatan Penelitian
3.3 Data Penelitian

vi
3.4 Rancangan Sampel dan Prosedur
3.4.1 Target Populasi Penelitian
3.4.2 Teknik Pengambilan Sampel
3.5 Variabel Penelitian
3.5.1 Variabel Independen atau Prediktor
3.5.2 Variabel Dependen
3.6 Sistematika Penelitian
3.7 Teknik Statistik8
3.7.1 Analisis Regresi Logistik
3.7.2 Evaluasi Overall Model9
3.7.3 Uji Statistik Individual Prediktor
3.7.4 Uji Statistik Goodness-of-fit
3.7.5 Validasi Predicted Probabilities
BAB 4
ANALISIS DAN PEMBAHASAN
4.1 Sampel dan Variabel
4.2 Uji Beda Parametik dan Non Parametik
4.3 Analisis Deskriptif
4.4 Uji Multikoliniearitas
4.5 Analisis dan Diskusi Hasil Pengujian Hipotesis
4.4.1 Uji Pengaruh Demografis
4.4.2 Uji Pengaruh Customer Satisfaction
4.4.3 Uji Pengaruh Switching Cost
4.4.4 Uji Pengaruh Customer Loyalty
4.4.5 Uji Pengaruh Perubahan Perilaku Beli
4.4.6 Uji Pengaruh Recency, Frequency, dan Monetary
4.4.6 Hasil Pengujian Permodelan Prediksi Pelanggan Churn
BAB 5
KESIMPULAN
5.1 Kesimpulan
5.2 Implikasi Manajerial
5.3 Implikasi Teoritis
5.4 Keterbatasan Penelitian
DAFTAR PUSTAKA

vii
DAFTAR GAMBAR

Gambar 1.1 Tren Pelanggan Operator Telekomunikasi di Indonesia


Gambar 1.2 Tren penurunan pendapatan per MB data internet
Gambar 2 Stage Customer Churn
Gambar 3.1 Klasifikasi Rancangan Penelitian
Gambar 3.2 Klasifikasi Teknik Samping
Gambar 3.3 Sistematika Penelitian yang Diolah Penulis
Gambar 3.4 Machine Learning Discovery Model Training

viii
DAFTAR TABEL

Tabel 2.1 Referensi data pelanggan yang digunakan untuk churn prediction
Tabel 2.2 Contoh Studi Customer Churn Prediction Modelling
Tabel 3.1 Independen Variabel yang Digunakan
Tabel 4.1 Hasil Uji Independent Sample T-Test
Tabel 4.2 Hasil Uji Statistik Mann-Whitney U
Tabel 4.3 Analisis Deskriptif Variabel Interval dan Rasio
Tabel 4.4 Analisis Deskriptif Variabel Kategorikal atau Nominal
Tabel 4.5 Hasil Korelasi antar Prediktor
Tabel 4.6 Hasil Koefisien Multikoliniearitas
Tabel 4.7 Uji Chi-square Prediktor Demografis
Tabel 4.8 Uji Nagelkerke R Square Prediktor Demografis
Tabel 4.9 Uji Persamaan Regresi Logistik Prediktor Demografis
Tabel 4.10 Uji Chi-square Prediktor Customer Satisfaction
Tabel 4.11 Uji Nagelkerke R-square Prediktor Customer Satisfaction
Tabel 4.12 Uji Persamaan Regresi Logistik Prediktor Customer Satisfaction
Tabel 4.13 Uji Chi-Squre Prediktor Switching Cost
Tabel 4.14 Uji Nagelkerke R-square Prediktor Switching Cost
Tabel 4.15 Uji Persamaan Regresi Logistik Prediktor Switching Cost
Tabel 4.16 Uji Chi-square Prediktor Customer Loyalty
Tabel 4.17 Uji Nagelkerke R-square Prediktor Customer Loyalty
Tabel 4.18 Uji Persamaan Regresi Logistik Prediktor Customer Loyalty
Tabel 4.19 Uji Chi-square Prediktor Perubahan Perilaku Beli
Tabel 4.20 Uji Nagelkerke R-square Prediktor Perubahan Perilaku Beli
Tabel 4.21 Uji Persamaan Regresi Logistik Prediktor Perubahan Perilaku Beli
Tabel 4.22 Uji Chi-square Prediktor RFM
Tabel 4.23 Uji Nagelkerke R-square Prediktor RFM
Tabel 4.24 Uji Persamaan Regresi Logistik Prediktor RFM
Tabel 4.25 Uji Chi-square Semua Predikor
Tabel 4.26 Uji Hosmer and Lemeshow Semua Prediktor
Tabel 4.27 Hasil Klasifikasi Semua Prediktor
Tabel 4.28 Uji Persamaan Regresi Logistik Semua Prediktor

ix
BAB 1

PENDAHULUAN

1.1 Latar Belakang


Di akhir tahun 2018, Indonesia terestimasi memiliki populasi penduduk sebesar
264.161.000 jiwa dengan figur angka penetrasi internet sebesar 64,8% atau dapat diartikan
jumlah pengguna internet telah mencapai 176.176.716 jiwa (Afidah dan Doom, 2019, p. 52).
Data-data tersebut menunjukan terjadinya pertumbuhan pegguna internet sebesar 10,12%
dibandingkan dengan tahun sebelumnya. Tren pertumbuhan serta tingkatan penetrasi penguna
internet seperti ini menempatkan Indonesia ke peringkat 10 teratas dalam hal indeks konektivitas
mobile sejak tahun 2014 (GSMA, 2018).

Pemaparan di atas mengindikasikan besarnya potensi pasar layanan telekomunikasi di


Indonesia, terlebih okupansi wilayah jaringan 2G, 3G, dan 4G yang hanya mencakup masing-
masing sebesar 58,5% (Afidah dan Doom, 2019, p. 57), 32,4% (Afidah dan Doom, 2019, p.58),
dan 42.5% (Afidah dan Doomm, 2019, p.59). Artinya, masih ada ruang untuk melakukan tidak
hanya penetrasi namun juga ekspansi pasar layanan telekomunikasi.

Namun demikian, proses analisis data yang lebih mendalam menunjukkan ruang ekspansi
pasar tersebut menjadi tidak relevan lagi. Hal ini disebabkan oleh tidak meratanya persebaran
populasi penduduk di Indonesia. Jaringan 3G dan 4G telah mencakup masing-masing sebesar
90% dan 80% persebaran posisi penduduk di Indonesia (GMSA, 2018). Mengatasi tantangan
sempitnya ruang ekspansi pasar ini semakin bertambah seiring dengan melambatnya laju
pertumbuhan penetrasi mobile internet yang menjadi backbone bisnis industri telekomunikasi
hingga ke level 1% saja (Frost and Sullivan, 2018).

Keadaan ini menyebabkan pasar layanan telekomunikasi telah berjalan menuju titik jenuh
yang turut menyebabkan melambatnya pertumbuhan pelanggan operator-operator layanan
telekomunikasi di Indonesia seperti Telkomsel, XL Axiata, Indosat, dan lainnya. Fenomena ini
dapat terlihat pada gambar 1.1 di bawah ini:

1
Gambar 1.1. Tren Pelanggan Operator Telekomunikasi di Indonesia

Kebijakan registrasi kartu SIM prabayar yang dicanangkan oleh pemerintah Indonesia
melalui Kementrian Komunikasi dan Informatika dan dilaksanakan oleh operator telekomunikasi
sejak kuartal 4 tahun 2017 turut menyusutkan ukuran pasar layanan telekomunikasi di Indonesia.
Tercatat sebanyak 68,5 juta kartu SIM prabayar telah diblokir dari kuartal 1 tahun 2018 hingga
kuartal 3 tahun 2018 (Fitch Solution, 2019) dan jumlah ini masih terus akan bertambah hingga
kuartal 4 tahun 2019 mendatang.

Pertumbuhan ukuran pasar layanan telekomunikasi yang berada di tahap stagnansi dalam
jangka waktu pendek ini membuat operator memaksimalkan potensi pasar yang sudah ada
sekarang melalui proses akuisisi maupun retensi. Tren rata-rata siklus penggunaan unit
smartphone yang selama kurang dari 2 tahun setiap unitnya (Shen, 2015) turut menjadi tantangan
tersendiri bagi operator dalam mempertahankan pelanggan pasca bayarnya. Masing-masing
perator telekomunikasi berlomba-lomba dalam menawarkan paket menarik melalui program
bundling dengan unit smartphone terbaru untuk mengakuisi segment pelanggan ini. Semakin
ketatnya persaingan antar operator telekomunikasi ini membuat mereka meningkatkan
competitive advantage masing-masing agar menjadi pilihan utama di mata pelanggan.

1.2 Rumusan Masalah


Salah satu faktor competitive advantage yang umum dieksploitasi oleh operator di
Indonesia dalam mengakuisisi pelanggan baru dan pelanggan kompetitor adalah pricing. Strategi

2
perang harga menjadi praktik yang sering digunakan operator telekomunikasi dalam mengelola
portofolio pelanggannya. Hal ini terlihat dari penurunan harga per 1GB data internet dari 1.1%
GDP per capita pada tahun 2016 turun hingga lebih dari 50% ke level 0.5% GDP per capita pada
tahun 2018 (GMSA, 2018).

Gambar 1.2. Tren penurunan pendapatan per MB data internet

Gambar 1.2 di atas menunjukkan penurunan pendapatan per MB (megabyte) data internet
secara konsisten dari kuartal 4 tahun 2016 hingga kuartal 1 2018 untuk semua operator
Telekomunikasi tanpa terkecuali. Tren ini diperkirakan akan terus berlangsung mengingat masih
terjadinya kontraksi harga paket internet kelas bawah sebesar 10%-15% dan 20-25% untuk harga
paket internet kelas menegah dari kuartal 1 tahun 2018 ke kuartal 2 tahun 2018. Meskipun
fenomena perang harga ini secara langsung berdampak pada menipisnya margin keuntungan
yang didapat oleh operator telekomunikasi, namun strategi ini tetap terus-menerus dilakukan
demi menjaga tingkat competitive advantage dengan operator telekomunikasi lainnya tanpa
terkecuali
Walaupun dalam beberapa studi terakhir menunjukkan pelanggan dari operator
telekomunikasi terbesar mengadapi switching cost yang lebih besar dan peluang perpindahan
pelanggan operator telekomunikasi yang lebih kecil ke operator telekomunikasi terbesar lebih
besar daripada peluang perpindahan pelanggan operator telekomunikasi terbesar ke operator
telekomunikasi yang lebih kecil dikarenakan faktor superioritas kualitas jaringan yang umum
dimiliki oleh operator telekomunikasi terbesar (Srinuan et al., 2011), namun tidak lama lagi dasar
ini berpotensi tidak relevan diterapkan di pasar layanan telekomunikasi Indonesia. Perubahan ini

3
utamanya disebabkan oleh mulai aktifnya inisiasi proyek Palapa Ring di semester kedua tahun
2019 (Fitch Solution, 2019) yaitu pembangunan jaringan serat optik nasional yang menjangkau
440 kabupaten/kota di 34 provinsi Indonesia untuk memberikan jaringan mobile data hingga ke
daerah-daerah 3T (terpencil, terluar, dan tertinggal). Berjalannya proyek ini menghilangkan
entry barrier bagi seluruh operator di Indonesia untuk beroperasi memberikan layanan
telekomunikasi di luar pulau Jawa yang sebelumnya secara dominan dikonsumsi oleh operator
terbesar.
Berjalannya proyek Palapa Ring ini secara tidak langsung menyebabkan competitive
advantage superioritas kualitas jaringan yang sebelumnya secara signifikan dimiliki oleh
operator telekomunikasi terbesar diprediksi akan menghilang. Prediksi ini juga diperkuat oleh
temuan penelitian sebelumnya terhadap perilaku pelanggan telekomunikasi di Indonesia bahwa
quality of service yang salah satunya dikontribusi oleh faktor kualitas jaringan tidak cukup kuat
untuk berpengaruh secara langsung terhadap customer loyalty (Fernandes dan Solimun, 2016).
Pertumbuhan pasar pelanggan layanan telekomunikasi di Indonesia yang menuju titik
jenuh ditambah dengan semua operator telekomunikasi melakukan strategi dan menerima
konsekuensi yang relatif berimbang dalam upaya tarik-menarik pelanggan tersebut, maka
dibutuhkan suatu model churn prediction yang secara akurat dapat melakukan pemetaan
pelanggan yang berpotensi tinggi melakukan terminasi kontrak dan berpindah ke kompetitor.
Kebutuhan ini menjadi mendesak mengingat semakin kecilnya margin keuntungan yang
diperoleh dari data internet mobile (GMSA, 2019) yang menyebabkan utilisasi biaya program
customer retention harus seefektif dan seefisien mungkin dengan menyasar segmen pelanggan
yang tepat.

1.3 Tujuan Penelitian


Berdasarkan pemaparan rumusan masalah di atas, secara garis besar penelitian ini akan
meliputi proses menentukan variabel independen atau prediktor yang relevan dengan keadaan
perilaku konsumen di pasar layanan telekomunikasi Indonesia saat ini dan menyusun suatu
churn prediction modelling dengan menggunakan prediktor tersebut untuk mencapai outpit atau
keluaran yang kekuatan akurasi prediksinya mendekati aktual. Adapun tujuan dari penelitian ini
adalah sebagai berikut:
1. Menganalisis pengaruh antara karakteristik demografis terhadap perilaku customer churn

4
2. Menganalisis pengaruh antara customer satisfaction terhadap perilaku customer churn
3. Menganalisis pengaruh switching cost terhadap perilaku customer churn
4. Menganalisis pengaruh customer loyalty terhadap perilaku customer churn
5. Menganalisis pengaruh perubahan perilaku beli terhadap perilaku customer churn
6. Menganalisis pengaruh recency, frequency, dan monetary (RFM) terhadap perilaku
customer churn
7. Menganalisis pengaruh karakteristik demografis, customer satisfaction, switching cost,
customer loyalty, perubahan perilaku beli, dan RFM secara simultan terhadap perilaku
customer churn

Kemudian, dengan menganalisa hasil penelitian dan menyimpulkan bentuk akhir customer
churn prediction modelling, studi ini akan memberikan rekomendasi tindakan pengembangan
strategi manajemen customer retention yang selaras dengan strategis bisnis perusahaan secara
keseluruhan dan bagaimana penurunan strategi tersebut ke dalam action plan yang bersifat taktis.

1.4 Signifikansi Penelitian


Penelitian ini melibatkan proses pra-penelitian dengan melakukan studi literatur dan
komparasi penelitian sejenis tentang faktor-faktor yang dapat mempengaruhi customer churn
baik di industri layanan telekomunikasi maupun industri lain yang sejenis. Selanjutnya,
penelitian ini akan melibatkan proses pra-penelitian yang sama untuk membandingkan customer
churn prediction modelling di penelitian-penelitian terdahulu demi membentuk model prediksi
customer churn prediction yang relevan terhadap karakteristik industri layanan telekomunikasi
Indonesia.

1.4.1 Manfaat Akademis


Penelitian ini akan memberikan sudut pandang yang komprehensif meliputi aspek
demografis, behavior (perilaku), attitude, dan geografis dalam menyusun churn prediction
modelling. Pengaplkasian sudut pandang baru yang dikombinasikan dengan churn prediction
modelling klasikal dan proses klasifikasi big data dapat memberikan alternatif berbeda sekaligus
memberikan pembaharuan terhadap konsep penyusunan model terdahulu

5
1.4.2 Manfaat Praktis
Penelitian ini dapat dimanfaatkan dan diimplementasikan secara langsung oleh
profesional perusahaan yang bergerak di bidang telekomunikasi terutama pada tingkat eksekutif
dalam melakukan re-adjustment strategi dan corporate action yang dibutuhkan berdasarkan
keadaan proyeksi customer churn terkini dan level operasional yang dalam kesehariannya dapat
mengeksekusi suatu customer action cepat yang sesuai dengan keluaran prediksi dari churn
prediction modelling ini.

1.4.3 Manfaat bagi Peneliti


Penelitian ini adalah sebagai platform dalam mengimplementasikan ilmu pengetahuan
dan kemampuan teknis penelitian yang didapatkan oleh peneliti selama menjadi mahasiswa
didik.

1.5 Sistematika Penulisan


Dalam menjabarkan proses penelitiannya, karya penelitian akhir ini akan menggunakan
sistematika pembahasan sebagai berikut:
Bab 1 Pendahuluan
Bab ini menguraikan latar belakang masalah, rumusan masalah, tujuan penelitian, ruang
lingkup penelitian, signifikansi penelitian, dan sistematika pembahasan karya peneliatian.

Bab 2 Tinjauan Pustaka


Bab ini menjabarkan pemahaman mengenai prediktor yang berpotensi dalam
mempengaruhi keputusan dan perilaku konsumen untuk melakukan churn atau bertahan
dalam menggunakan layanan dari suatu operator layanan telekomunikasi. Lebih jauh
lagi, di bab ini turut menjelaskan bagaimana perubahan perilaku dari konsumen layanan
telekomunikasi dan bagaimana perkembangan dari churn prediction modelling dalam
mengakomodir perubahan-perubahan ini.

Bab 3 Metodologi Penelitian


Bab ini menjelaskan tentang metodologi penelitian yang akan digunakan, rancangan
penelitian, proses dan metode pengambilan data penelitian, gambaran populasi
6
dibadingkan dengan ukuran sampel, ukuran sampel penelitian dan deskripsinya, proses
klasifikasi big data, serta pengukuran secara statistik penelitian

Bab 4 Analisa dan Pembahasan


Bab ini memapatkan tentang hasil proses data penelitian yang meliputi analisis statistik
pra-uji, klasifikasi dan reduksi data penelitian, penemuan-penemuan yang ada di alam
proses data training hingga bentuk akhir churn prediction modelling.

Bab 5 Kesimpulan
Di dalam bab ini, peneliti akan menjabarkan kesimpulan dari hasil pengolahan data dan
temuan penelitian, implikasi bagi praktisi, implikasi terhadap teori yang ada, dan arahan
terkait dengan penelitian selanjutnya untuk memperkaya hasil studi ini.

7
BAB 2

LANDASAN TEORI

2.1 Faktor yang Mempengaruhi Customer Churn


Customer churn adalah istilah yang umum digunakan untuk mendeskripiskan keadaan seseorang
atau kelompok pelanggan yang sebelumnya membeli suatu produk atau berlangganan suatu
layanan kemudian memutuskan untuk berhenti setelah beberapa waktu yang disebabkan oleh
berbagai faktor. Tidak jarang pelanggan yang melakukan churn berpindah ke produk atau
layanan kompetitor. Berbagai literatur telah menguraikan 3 tipe customer churn sebagai berikut
(Lazarov dan Capota, 2007):
a) Active Churner (volunteer): pelanggan yang dengan sadar dan ingin mengakhiri kontrak
untuk berpindah ke provider lainnya
b) Passive Churner (non-voluntary): situasi di mana perusahaan atau provider yang
memutuskan untuk mengakhiri kontrak
c) Rotational Churner (silent): situasi di mana pelanggan memutuskan untuk tidak
melanjutkan kontrak tanpa pemberitahuan sebelumnya dari kedua belah pihak; baik
pelanggan maupun provider dapat dengan tiba-tiba memutuskan kontrak tanpa
memberikan notifikasi sebelumnya
Adapun menurut Berry dan Linoff (2004), customer churn di dalam industri jasa layanan
telekomunikasi dapat dibagi menjadi 2, yaitu voluntary churn dan involuntary churn. Voluntary
churn adalah pelanggan yang memutuskan untuk mengakhiri kontrak sedangkan involuntary
churn terjadi saat perusahaan memutuskan kontrak dikarenakan adanya pelanggaran syarat dan
ketentuan yang sudah disepakati seperti penyalahgunaan, keterlambatan pembayaran, dan
sebagainya.
Penelitian-penelitian yang telah ada sebelumnya telah fokus terhadap determinan yang
mendorong atau indikator yang menandakan pelanggan untuk melakukan churn. Beberapa
determinan atau indikator yang telah ditemukan tersebut seperti service quality dan tingkat
konsumsi produk atau layanan (Quach, 2015), perilaku penggunaan produk atau layanan (Geetha
dan Kumari, 2011), serta customer satisfaction dan switching cost (Svensen dan Prebensen,
2011). Studi pendahulu ini mentitikberatkan hubungan kasualitas antara masing-masing

8
determinan atau indikator terhadap customer churn. Di dalam salah satu studi tersebut, peneiliti
memberikan argumen bahwa pada dasarnya customer churn adalah suatu proses yang dapat
dibedakan menjadi 3 sub proses atau stage (Geetha dan Kumari, 2011) seperti yang tampak pada
gambar 2 di bawah ini.

Gambar 2. Stage Customer Churn

2.2 Data yang Digunakan di Dalam Customer Churn Prediction Modelling


Salah satu jenis data yang paling umum digunakan adalah data sekunder berupa data
historis, demografis, dan penggunaan pelanggan yang dimiliki oleh operator. Penelitian yang
dilakukan oleh Li et al. (2015) menggunakan subscriber information yang sudah ada untuk
memprediksikan customer yang akan melakukan churn yang di antaranya adalah basic
subscriber properties, billing information, dan behavioral information yang dijabarkan
atributnya oleh tabel 2.1 di bawah ini:

Tabel 2.1. Referensi data pelanggan yang digunakan untuk churn prediction

9
No Kategori Atribut Deskripsi
1 SERIAL NUM Unique ID to identify a subscriber
2 CUST TYPE Level classified by the monthly paying bills
3 GROUP TAG Flag on whether a subscriber belongs to a group
Basic
4 GENDER Gender of a subscriber
5 AGE Age of a subscriber
6 STATUS Current account status of a subscriber
7 ACCT BAL Current cash in the subscriber account
8 SP FEE Extra service income
9 CZ FEE Total charged cash
10 CUR INCOME Total revenue
Billing
11 TRAVEL FEE Generated fee outside the belonging district
12 ACT FEE Promotion activity fee sent to the subscriber
13 ACT REST Rest promotion activity fee to be sent
14 OWE FEE Arrears fee
15 COMPLAIN NUM Number of subscriber complaints
16 CZ NUM Cash charging times
17 CALL TIMES1 Total call frequency from 8 a.m. to 6 p.m.
18 CALL TIMES2 Total call frequency from 6 a.m. to 8 p.m.
19 Behavior CALL DURATION Total calling duration
20 NEIGHBOR NUM Total number of neighbors that have communicated with a subscriber
21 INDEGREE NUM Total number of neighbors that made calls to a subscriber
22 OUTDEGREE NUM Total number of neighbors that a subscriber called actively
23 OTHER RATE Ratio of neighbors that belong to other operators

Senada dengan utilisasi data sekunder tersebut, perilaku pelanggan dapat diketahui melalui
komponen jenis produk atau layanan yang digunakan dan seberapa sering merka
menggunakannya (Johny dan Mathai, 2017).
Selain data sekunder pelanggan yang merepresentasikan behavior (perilaku), data
sekunder pelanggan yang merepresentasikan attitude (sikap) juga umum digunakan dalam
komputasi data churn prediction modelling. Studi yang dilakukan oleh Bellman et al. (2010)
menyimpulkan bahwa indikator commitment menjadi predictor customer churn yang signifikan.
Indikator komitmen berasal dari salah satu data sekunder pelanggan yaitu frekuensi perubahan
main plan yang dilakukan oleh pelanggan.
Meskipun utilisasi data sekunder pelanggan ini telah umum digunakan oleh peneliti atau
praktisi ke dalam model customer churn prediction modelling masing-masing, namun hal ini
tidak menutup kemungkinan penggunaan data sekunder dari sumber lainnya. Lee et al. (2017) di
dalam penelitiannya berusaha membandingkan akurasi customer churn prediction modelling-nya
jika dibandingkan dengan modelling umum yang menggunakan data pelanggan. Hasil yang
didapat adalah dengan menggunakan data mining terhadap kemunculan kata-kata kunci yang

10
ditetapkan sebelumnya di portal berita online ke dalam suatu churn prediction modelling
mereplikasikan prediction rate yang mirip dengan model analisis menggunakan data pelanggan.

2.3 Pengaruh Karakteristik Demografis terhadap Customer Churn


Pengaruh dan jenis hubungan karakteristik demografis pelanggan terhadap keputusan
pelanggan untuk churn atau melanjutkan berlangganan telah menjadi subjek studi yang umum
dilakukan. Hal ini dikarenakan karakteristik demografis pelanggan yang unik menghasilkan
persepsi terhadap nilai benefit dan switching cost yang berbeda-beda.
Salah satu penelitian yang dilakukan terhadap pelanggan jasa layanan telekomunikasi di
Thailand menemukan bahwa beberapa karakteristik pelanggan seperti umur, jenis pekerjaan,
iterasi penggunaan internet, dan wilayah domisili pelanggan dengan signifikan menjelaskan
switching behavior (Srinuan et al., 2011). Jenis pengaruh karakteristik demografis terhadap
churn juga tidak terbatas hanya ke pengaruh secara langsung. Seperti yang dijabarkan di dalam
penelitian yang dilakukan Rambocas et al. (2016) bahwa beberapa karakteristik demografis
seperti umur dan tingkat pendidikan bertindak sebagai variabel moderasi dalam hubungan
customer satisfaction-switch. Menindaklanjuti temuan teoritis ini, maka hipotesis pertama
penelitian ini adalah:
H1a: Umur pelanggan berpengaruh secara signifikan terhadap perilaku churn pelanggan
Di dalam konteks industri telekomunikasi, operator secara gradual memperkenalkan
teknologi mobile network baru, seperti network 5G yang akan datang. Namun, tidak semua jenis
teknologi yang disematkan pada sebuah mobile device dapat mengakomodasi semua tingkatan
layanan mobile network. Iyengar et al. (2008) menyimpulkan bahwa 2 faktor yang menyebabkan
pelanggan memilih salah satu tipe mobile device daripada tipe lainnya adalah akses ke teknologi
baru dan harga. Belum lagi 72% pengguna smartphone memiliki siklus penggunaan satu mobile
device di bawah 2 tahun (Shen, 2015) sehingga meningkatkan peluang terjadinya churn di setiap
titik waktu penggantian mobile device. Dengan adanya fenomena-fenomena tersebut, maka
hipotesis kedua penelitian ini adalah:
H1b: Jenis mobile device berpengaruh secara signifikan terhadap perilaku churn pelanggan
Namun, tidak semua karakteristik pelanggan mempunyai efek terhadap keputusan
pelanggan untuk churn atau melanjutkan berlangganan. Studi yang dilakukan Svendsen dan
Prebensen (2011) menyimpulkan bahwa jenis kelamin pelanggan tidak mempunyai pengaruh

11
signifikan terhadap churn. Jenis pengaruh karakteristik demografis terhadap churn juga tidak
terbatas hanya ke pengaruh secara langsung. Seperti yang dijabarkan di dalam penelitian yang
dilakukan Rambocas et al. (2016) bahwa beberapa karakteristik demografis seperti umur dan
tingkat pendidikan bertindak sebagai variabel moderasi dalam hubungan customer satisfaction-
switch.

2.4 Pengaruh Customer Satisfaction terhadap Customer Churn


Customer satisfaction timbul dari persepsi subjektif pelanggan terhadap kinerja produk
atau layanan setelah pemakaian yang dibandingkan dengan ekspektasi awal sebelum pemakaian
(Kim et al., 2015). Customer satisfaction tercipta di suatu situasi di mana ekspektasi pelanggan
tercapai atau bahkan terlampaui (Oliver, 1981). Di bawa ke dalam cakupan pembahasan industri
jasa layanan telekomunikasi, customer satisfaction melambangkan penilaian secara menyeluruh
pelanggan terhadap penyedia jasa layanan telekomunikasinya hingga saat ini (Keiningham et al.,
2014). Di dalam penjabarannya, customer satisfaction dapat dijelaskan dengan membaginya ke
dalam 2 perspektif, yaitu berbasis transaksi dan berbasis kumulatif (Kuo et al., 2009). Dari
perspektif transaksi, customer satisfaction ditentukan setelah proses post-choice untuk membeli
suatu produk atau layanan. Sedangkan pengalaman yang diperoleh dari konsumsi suatu produk
atau layanan selama periode waktu tertentu dapat menjelaskan customer satisfaction berbasis
kumulatif.
Di dalam berbagai research model yang umum digunakan di dalam studi-studi marketing,
customer satisfaction tidak terlepas dari hubungannya dengan service quality, switching barrier,
dan customer loyalty atau customer retention. Shafei dan Tabaa (2015) menjabarkan bahwa
customer loyalty selain oleh switching barrier juga dipengaruhi oleh customer satisfaction yang
di mana customer satisfaction ini dikontribusi oleh dimensi service quality yang bersifat basic
seperti network quality, customer support, dan pricing structure. Hubungan antara customer
satisfaction dan customer loyalty ini bersifat langsung dan positif tanpa diperlukannya sebuah
variabel mediator seperti switching cost (Ram dan Wu, 2015) meskipun secara kekuatan
hubungannya terhadap customer loyalty lebih lemah jika dibandingkan dengan variabel lain
seperti switching barrier (Chuah et al., 2016).
Di dalam penelitian yang sama, Chuah et al. (2016) mengadopsi 4 item pengukuran yang
digagas oleh Hennig-Thurau (2004) untuk memperoleh besaran customer satisfaction dari

12
pelanggan. Adapun keempat item pengukuran ini menggunakan skala likert dengan menanyakan
tingkat kepuasan pelanggan terhadap user experience secara keseluruhan dan kemampuan
penyedia jasa layanan untuk memenuhi ekspektasi. Pada studi lainnya yang dilakukan oleh
D’Allesandro et al. (2014), pengukuran terhadap customer satisfaction ini kemudian didetailkan
lagi ke 4 sub kategori kepuasan yang terdiri atas tingkat kepuasan terhadap penyedia jasa
layanan, cakupan atau jangkauan jaringan, harga, kinerja customer service, dan ketentuan
kontrak yang diadopsi dari model yang diajukan oleh Ozer (2005). Oleh karena itu, hipotesis
penelitian ke-3 dan ke-4 dari penelitian ini adalah:
H2a: Nilai rata-rata kepuasan pelanggan berpengaruh secara signifikan terhadap perilaku churn
pelanggan
H2b: Nilai akhir kepuasan pelanggan berpengaruh secara signifikan terhadap perilaku churn
pelanggan

2.5 Pengaruh Switching Cost terhadap Customer Churn


Switching cost adalah cost yang dibutuhkan oleh seseorang atau pelanggan dalam
menemukan, mengevaluasi, dan mengadopsi solusi alternatif (Hawkins et al., 2007). Hal ini
termasuk uang, waktu, dan tekanan psikologis ketika menghadapi instrumen-instrumen yang
belum bisa dipastikan saat berpindah ke solusi alternatif atau kompetitor. Switching cost
berperan dalam menekan fleksibilitas pergerakan pelanggan dan menurunkan tekanan atas
kemungkinan pelanggan untuk berpindah ke kompetitor (Xavier dan Ypslianti, 2008).
Chuang dan Tai (2015) di dalam penelitiannya terhadap semua studi di dalam jurnal
business and management periode 1996-2013 menemukan bahwa switching cost adalah
predictor yang sering digunakan dalam menjelaskan switching intention bersamaan dengan
customer satisfaction dan attractiveness of alternatives. Pola ini juga terlihat di studi yang
dilakukan oleh Ram dan Wu (2015) di mana secara parsial switching barriers diasosiakan
dengan predictor yang membuat pelanggan memutuskan untuk berhenti menggunakan layanan.
Kemudian, Shafei dan Tabaa (2015) mengemukakan lebih lanjut terkait 3 switching barriers
utama yang paling dirasakan oleh pelanggan, yaitu adaptation cost, loss cost, dan attractiveness
of alternatives.

13
Namun demikian meskipun variabel atau konstruk yang membentuk switching cost sudah
diketahui, pelanggan masih dihadapkan dengan persepsi atas tingkatan switching cost yang
berbeda-beda. Srinuan et al. (2011) melalui studinya terhadap pelanggan jasa layanan
telekomunikasi di Thailand menemukan bahwa berlangganan di operator besar dengan share
pasar yang dominan cenderung menghadapi switching cost lebih tinggi dibandungkan dengan
berlangganan di operator yang lebih kecil. Fenomena ini menjadi alasan operator kecil di negara
tersebut harus berkompetisi dengan harga terjangkau sembari meningkatkan kualitas layanan.
Maka dari itu, penelitian ini mengajukan hipotesis penelitian ke-5 sebagai berikut:
H3: Tingkat market share operator berpengaruh secara signifikan terhadap perilaku churn
pelanggan
Dalam mengukur nilai switching barriers yang diraskan oleh pelanggan selain
mengadopsi instrumen survey, ada beberapa data konsumsi pelanggan yang dapat digunakan.
Kim et al. (2017) di dalam penelitiannya memanfaatkan data di antaranya service bundling,
remaining contract months, dan membership points. Service bundling dan membership points
dapat mengindikasikan besaran nilai yang harus ditinggalkan pelanggan jika memutuskan untuk
berpindah ke penyedia layanan alternatif. Sedangkan semakin kecil nilai remaining contract
months, maka semakin kecil pula penalti yang harus dikeluarkan ketika memutuskan untuk
berpindah layanan.

2.6 Pengaruh Customer Loyalty terhadap Customer Churn


Secara umum, customer loyalty dapat dijelaskan dengan 2 sub kategori, yakni behavioral
loyalty dan attitudinal loyalty. Behavioral loyalty terjadi apabila seorang pelanggan melakukan
pembelian secara berulang terhadap suatu produk atau merek yang sama, meskipun tidak
dibarengi dengan preferensi sikap (Dodd, 2002). Sedangkan menurut Jacoby dan Chestnut
(1978), attitudinal loyalty ditunjukkan melalui kecenderungan pelanggan untuk memilih suatu
produk atau merek sebagai hasil dari proses psikologi. Perwujudan customer loyalty melalui
behavioral loyalty dan attitudinal loyalty menjadi salah satu indikator penting untuk membuat
pelanggan resisten terhadap penawaran produk atau layanan kompetitor dan mencegah terjadinya
churn. Dengan demikian, tingkatan customer loyalty berhubungan erat dengan perilaku dan
Shafei dan Tabaa (2015) mengajukan model penelitian untuk mengukur hubungan antara
customer satisfaction dan switching barriers terhadap customer loyalty. Adapun customer

14
satisfaction dibentuk oleh construct service quality sedangkan switching barriers dibentuk oleh
construct switching cost dan attractiveness of alternatives. Penelitian ini menyimpulkan bahwa
customer satisfaction menjadi predictor utama dalam menjelaskan customer loyalty yang
kemudian baru diikuti oleh switching barrier. Lebih kecilnya signifikansi switching barrier
dibandingkan dengan customer satisfaction dalam menjelaskan customer loyalty dipengaruhi
oleh masuknya pemain baru di sektor jasa layanan telekomunikasi yang menyebabkan
banyaknya pilihan bagi pelanggan.
Di dalam penelitian yang lain, Ram dan Wu (2015) memperkuat temuan di penelitian
sebelumnya dan menambah perspektif baru bahwa customer satisfaction dan brand image
mempunyai hubungan langsung dan secara positif mempengaruhi customer loyalty. Switching
cost juga disimpulkan tidak mempunyai pengaruh secara langsung terhadap customer loyalty,
yang mengisyaratkan adanya item mediasi yang dibutuhkan seperti switching barriers pada
penelitian yang dilakukan oleh Shafei dan Tabaa (2015) sebelumnya. Mengingat pelanggan
yang satu dengan yang lainnya mempunyai kebutuhan dan cara pemenuhan kebutuhan yang
berbeda, maka dalam hal pengelolaan customer loyalty perusahaan perlu melakukan analisis dan
segmentasi dan analisis data untuk menghasilkan tingkat loyalty yang sama dari segmentasi
pelanggan yang berbeda (Gee et al., 2008).
Mengatasi masalah ini, Zeithaml et al. (2001) mencoba mengajukan sebuah framework
dalam mengategorikan pelanggan dengan membanginya ke 4 tingkatan, yakni platinum dan gold
untuk pelanggan yang dianggap prioritas serta iron dan lead untuk pelanggan yang dianggap non
prioritas. Segmen platinum dan gold merupakan pengguna dengan konsumsi terbanyak dan tidak
terlalu sensitif terhadap harga. Kedua kategori ini menunjukkan komitmen tinggi dan mudah
untuk mencoba layanan baru. Secara kontras, kategori lead dan iron dikarakteristikkan dengan
kontribusi pembelian, tingkat loyalty, dan tingkat profitabilitas yang lebih rendah. Temuan ini
juga didukung oleh Xiong et al. (2013) di dalam studinya yang menyimpulkan bahwa secara
umum elite member memiliki tingkat loyalty yang lebih tinggi dibandingkan dengan basic
member. Maka dari itu, hipotesis ke-6 yang diajukan adalah:
H4a: Tipe segmentasi pelanggan berpengaruh secara signifikan terhadap perilaku churn
pelanggan
Dalam melayani pelanggan dengan berbagai segmentasi, tingkat loyalty, dan pemenuhan
kebutuhan yang berbeda ini, sebuah penyedia jasa layanan akan menggunakan loyalty program.

15
Loyalty program menjanjikan akumulasi benefit ekonomikal bagi pelanggan yang membeli
produk atau layanan dari brand tertentu (Dowling dan Uncles, 1997). Pada kondisi yang tepat,
loyalty program dapat membangun customer relationship yang lebih kuat, jaminan pelanggan
untuk menetap, dan menaikkan revenue secara bertahap (2006). Cara kerja dari mekanisme ini
adalah dengan menukarkan loyalty poin yang diperoleh dari akumulasi kontribusi profitibilitas
pelanggan terhadap perusahaan untuk ditukarkan dengan insentif yang beragam. Oleh karena itu,
hipotesis ke-7 dan ke-8 dari studi ini adalah:
H4b: Loyalty poin berpengaruh secara signifikan terhadap perilaku churn pelanggan
H4c: Keikutsertaan loyalty program berpengaruh secara signifikan terhadap perilaku churn
pelanggan
Keadaan customer loyalty juga dapat diukur oleh length of stay atau relationship length.
Idenya adalah length of stay atau relationship length diartikan sebagai durasi sejak pelanggan
memulai dan mengembagkan hubungan dengan sebuah penyedia produk atau layanan (Bolton,
1998). Argumentasinya adalah hubungan yang terjalin dengan jangka waktu yang panjang dapat
menghasilkan trust yang lebih tinggi dan menciptakan locked-in effect (Doney dan Cannon,
1997). Lebih jauh, length of stay atau relationship length yang lebih lama dapat mengarah
kepada akumulasi peceived switching barrier yang lebih banyak di pelanggan dan pada akhirnya
dapat mempengaruhi customer loyalty (Jones et al., 2002). Jadi, hipotesis ke-9 dari penelitian ini
adalah:
H4d: Length of stay berpengaruh secara signifikan terhadap perilaku churn pelanggan

2.7 Pengaruh Perilaku (Behavior) terhadap Customer Churn


Cara yang paling efisien dalam mempertahankan pelanggan dan mecegah churn adalah
dengan mengetahui pola pelanggan yang menuju churn, mengidentifikasi alasannya, dan
melakukan desain ulang strategi customer retention yang sudah ada berdasarkan pengetahuan
yang sebelumnya diperoleh tersebut. Seorang pelanggan dapat dikatakan rentan untuk churn
apabila terdapat deviasi perubahan buying behavior dari biasanya (Buckinx dan Poel, 2005).
Telah banyak studi yang dilakukan di berbagai negara untuk mengetahui perubahan perilaku
spesifik dari pelanggan di negara-negara tersebut yang dapat mengindikasikan apakah sudah
dapat dikategorikan rentan untuk churn atau tidak. Pelanggan jasa layanan telekomunikasi di
Australia yang rentan untuk churn dapat terlihat dari semakin seringnya frekuensi mengganti

16
paket berlangganan atau main plan (Zorn et al., 2010). Fenomena ini digerakkan oleh perasaan
ketidakpastian yang muncul di diri pelanggan mengenai nilai benefit yang akan diterima jika
memilih untuk bertahan. Menarik adanya perubahan perilaku membeli ini, maka hipotesis ke-10,
11, dan 12 dari penelitian ini adalah:
H5a: Pergerakan jumlah transaksi pelanggan berpengaruh secara signifikan terhadap perilaku
churn pelanggan
H5b: Pergerakan jumlah nominal revenue pelanggan berpengaruh secara signifikan terhadap
perilaku churn pelanggan
H5c: Pergerakan jumlah nominal revenue dari kategori produk dominan pelanggan berpengaruh
secara signifikan terhadap perilaku churn pelanggan
Bergerak ke negara lain, penelitian yang dilakukan oleh Geetha dan Kumari (2011)
terhadap pelanggan jasa layanan telekomunikasi di India menyimpulkan bahwa pola network
usage di luar jaringan operator tersebut dapat mengindikasikan kecenderungan customer churn.
Pelanggan dengan VAS (value added service) yang lebih besar, melakukan panggilan ke
jaringan kompetitor dengan frekuensi yang lebih sering, dan RPM (revenue per minute) lebih
besar dari 75 paise cenderung untuk melakukan churn. Sedangkan penelitian di Korea
menemukan bahwa melakukan berbagai paket bundling terhadap main plan seperti
memasangkan paket telekomunikasi dengan kuota internet cepat menjadi business model yang
semakin efektif dan sustainable (Kim et al., 2017). Model bisnis ini juga dituntut untuk
melakukan kombinasi bundling yang dinamis mengingat seiring dengan lama berlangganannya
seorang pelanggan, maka semakin dekat juga pelanggan tersebut untuk mencapai service
plateau.
Dalam mendeteksi perilaku pelanggan menggunakan variabel yang
mempresentasikannya, variabel seperti recency, frequency, dan monetary (RFM) adalah
prediktor terbaik dalam membedakan pelanggan yang loyal dan non loyal (Dursun dan Caber,
2016). Pembelian kembali atau berulang cenderung menurun jika waktu setelah pembelian
terakhir semakin panjang atau lama (Neslin, et al., 2012). Kemungkinan pelanggan untuk
melakukan pembelian yang berulang dan merespon terhadap marketing effort dipengaruhi oleh
panjang durasi recency. Berdasarkan hal ini, maka hipotesis ke-13 dari penelitian ini adalah:
H6a: Recency berpengaruh secara signifikan terhadap perilaku churn pelanggan

17
Tidak hanya durasinya, besaran transaksi dan pembelian terakhir dapat menjelaskan
behavior pelanggan selanjutnya dengan lebih besar dibandingkan dengan pembelian-pembelian
sebelumnya. Hal ini ditunjukkan oleh Shapoval dan Setzer (2017) yang memberikan pembobotan
lebih besar terhadap pembelian terakhir di dalam permodelan prediksinya. Maka, hipotesis ke-
14, 15, dan 16 penelitian ini adalah:
H6b: Jumlah transaksi terakhir berpengaruh secara signifikan terhadap perilaku churn
pelanggan
H6c: Jumlah nominal revenue terakhir berpengaruh secara signifikan terhadap perilaku churn
pelanggan
H6d: Jumlah nominal revenue terakhir dari kategori produk dominan berpengaruh secara
signifikan terhadap perilaku churn pelanggan

2.8 Jenis Metodologi untuk Membentuk Customer Churn Prediction Modelling


Dalam industri telekomunikasi dengan pasar yang menuju titik jenuh dan semakin
kompetitif, mencegah terjadinya pelanggan yang churn menjadi kebutuhan yang mendesak
karena cost yang dibutuhkan untuk mengakuisisi pelanggan baru lebih besar dibandingkan
mempertahankan pelanggan eksisting (Li, 2015). Oleh karena itu, diperlukan suatu customer
churn prediction modelling yang tidak hanya akurat namun relevan dengan situasi pasar terkini
dalam menganalisa kemungkinan seseorang pelanggan churn atau tidak. Spesifik untuk
implementasi terhadap sebuah operator di industri telekomunikasi, customer churn prediction
modelling-nya akan memanfaatkan komputasi big data dikarenakan besarnya jenis dan jumlah
data. Hal ini dilakukan mengingat teknik data mining dapat memberikan kinerja prediksi yang
lebih baik dan akurat jika dibandingkan dengan metode statistik tradisional (Ngai et al., 2009)
Model yang diadopsi secara luas dalam memperediksikan customer churn adalah binary
classification model yang membedakan output pengukuran ke churners atau pelanggan yang
melakukan churn dan non-churners atau pelanggan yang tidak melakukan churn (Kurnar dan
Grag, 2013). Adapun beberapa alat analisis statistik binary classification yang umum digunakan
adalah neural networks, decision tree, dan logistic regression.
Neural networks termotivasi atau terinspirasi dari cara kerja sebuah komponen pengolah
informasi di dalam otak manusia yang bernama neuron (Haykins, 1999). Metode ini terbagi ke
dalam 3 layer yang terdiri atas input yang digunakan untuk memasukkan nodes atau variabel

18
data, hidden layer atau blackbox yang menjadi tempat terjadinya proses komputasi nodes di
mana training pembobotan dan alogaritma dilakukan, dan output layer sebagai keluaran hasil
dari komputasi nodes (Lin et al., 2014).
Decision tree atau sering disebut dengan CART (classification and regression tree)
adalah teknik populer untuk mengkonstruksi klasifikasi berdasarkan jenis dependent variable-
nya yang dapat bertipe kategorikal maupun numerikal (Breiman et al.,1984). Metode ini berguna
dalam mengeksplorasi data dan menemukan hubungan yang tidak terlihat antara sejumlah calon
independent variable atau data input dengan sebuah dependent variabel.
Logistic regression adalah salah satu model statistik klasifikasi yang mngukur hubungan
antara dependent variable yang bersifat kategorikal dengan satu atau lebih independent variable
yang di mana independent variable ini seringnya berjenis continuous. Alat statistik ini
memudahkan peneliti untuk melihat kesesuaian model penelitian dan sekaligus mengukur
signifikansi hubungan antara dependent variable dan satu atau lebih independent variable
(Hosmer dan Lemeshow, 2000).
Penggunaan metode atau alat statistik klasifikasi seperti di atas juga digunakan oleh
penyedia jasa layanan telekomunikasi dan industri sejenis untuk membangun customer churn
prediction modelling. Adapun beberapa contoh di antaranya adalah sebagai berikut:

Tabel 2.2. Contoh Studi Customer Churn Prediction Modelling

19
No Title Year Author Methodology Variable

Steffen Zorn frekuensi kunjungan ke website


Dimensionality and data
Conventional
1 Attitudinal perspectives 2010 Wade Jarvis frekuensi review
Regression
for predicting churn
Steve Bellman frekuensi pembelian produk

Jumlah nomor HP
Tariff Rate
Tariff
M. Geetha Admin Fee revenue
Analysis of churn
Generalized Linear
2 behavior of consumers in 2011 Transaksi isi pulsa dalam sebulan
Jensolin Abitha Modelling (GLM)
Indian telecom sector Jumlah saldo isi pulsa
Kumari
Jumlah menit penggunaan
VAS revenue
Total usage revenue
Tipe provider
Gunnvald B. Gender
The effect of brand on
Svendsen
3 churn in the 2011 Logistic Regression Customer satisfaction
telecommunications sector Switching cost
Nina K. Prebensen
Age
#Sisa bulan kontrak main plan
VOC: jumlah komentar di social media
Myung-Joong Kim Lama berlangganan
Understanding IPTV
Logistic Jumlah channel view
4 churning behaviors: focus 2017 Sun-Young Park
Regression Jumlah video-on-demand view
on users in South Korea
Juil Kim Jumlah tv-on-demand view
Jumlah pay-per-view
Jumlah layanan perbulan

2.10 Limitasi Customer Churn Prediction Modelling di Sektor Telekomunikasi


Meskipun customer churn prediction modelling pada jasa layanan telekomunikasi sudah
banyak dilakukan, namun hal yang sama tidak dapat dikatakan di Indonesia yang hampir
dipastikan tidak memiliki studi sejenis. Sejauh ini, penelitian yang dilakukan terfokus pada
menemukan faktor yang mempengaruhi loyalty dan mengukur hubungan di antara faktor-faktor
tersebut seperti yang dilakukan oleh Fernandes dan Solimun (2017). Studi tersebut secara
terbatas mambahas efek mediasi customer satisfaction di hubungan antara service quality,
service orientation, dan marketing mix strategy terhadap customer loyalty pelanggan industri
layanan telekomunikasi Indonesia.
Fenomena ini menjadi wajar mengingat customer churn prediction modelling cenderung
mengambil perspektif makro sehingga gagal memperhitungkan faktor bahwa tendensi individual

20
dapat mempengaruhi keputusan churn pelanggan (Lee et al., 2017). Hal ini menguatkan temuan
di studi-studi terdahulu yang menyimpulkan perusahaan mengalami kesulitan dalam
memprediksikan churn karena pelanggan yang sangat heterogen (Bell et al., 2002; Lewis, 2006).
Membuat customer churn prediction modelling yang didasarkan pada perilaku pelanggan
individual menjadi kunci untuk mengatasi masalah tersebut.
Kemudian, customer churn prediction modelling yang menggunakan data real perilaku
dan konsumsi pelanggan juga tidak lepas dari kekurangan. Menurut Ganesh et al. (2000), sangat
sedikit studi yang melibatkan variabel customer satisfaction dan variabel yang berhubungan
terhadap attitude atau sikap di dalamnya. Kendala ini yang juga dihadapi oleh Kim et al. (2017)
yang menemukan bahwa terbatasnya kesediaan data sekunder terkait dengan customer
satisfaction, intensi untuk melanjutkan layanan, customer loyalty, dan switching intention
menghalangi mereka untuk melakukan studi yang lebih mendalam.

21
BAB 3

METODE PENELITIAN

3.1 Jenis Metodologi Penelitian


Penelitian ini dilakukan dengan menggunakan metode penelitian kuantitatif yang
di mana prosesnya meliputi investigasi dan pembuktian empiris dari fenomena yang
diobservasi melalui teknik statistik, matematik, dan komputasi (Given, 2008). Tujuan
dari penelitian kuantitatif ini adalah untuk membangun model matematis, teori, dan
hipotesis yang berkaitan dengan suatu fenomena. Jenis data yang digunakan di dalam
penelitian kuantitatif adalah berformat numerikal dan proses pengolahan data atau
informasi ini terbatas pada ruang lingkup fenomena yang sedang dikaji.

3.2 Rancangan dan Pendekatan Penelitian


Rancangan penelitian merupakan kerangka kerja yang digunakan sebagai
panduan dan referensi secara terperinci prosedur yang diperlukan untuk memperoleh
konklusi dari satu atau lebih permasalahan penelitian (Malhotra, 2012). Hasil temuan
konklusi tersebut kemudian dapat digunakan sebagai penambahan pengetahuan ke
dalam marketing theory paradigm yang sudah ada atau acuan dalam pengambilan
keputusan manajerial perusahaan. Gambar 3.1 di bawah ini menunjukkan klasifikasi
rancangan penelitian yang umum dalam suatu studi riset pemasaran.

Gambar 3.1. Klasifikasi Rancangan Penelitian

22
Penelitian ini mengadopsi rancangan penelitian konklusif dengan pendekatan
penelitian deskriptif. Adapun penelitian deskriptif bertujuan untuk menggambarkan
situasi yang sedang terjadi pada saat penelitian dilakukan (Travers, 1978). Studi
deskriptif diaplikasikan mengingat studi ini ingin medeskripsikan dengan lebih detail
terkait dengan fenomena yang sudah diketahui ada dan terjadi, yakni customer churn
pada industri jasa layanan telekomunikasi.
Kemudian dilihat dari sisi pendekatan waktu, penelitian ini mengadopsi
rancangan penelitian cross-sectional. Hal ini dikarenakan sifat pengumpulan data atau
informasi dari setiap subjek akan dilakukan satu kali dalam beberapa periode tertentu.
Beberapa periode ini akan ditarik mundur dari waktu terjadinya churn (bulan-n) hingga
waktu k sebelum terjadinya churn (bulan-k). Penarikan data ini akan diambil di setiap
bulan-k hingga bulan-n.

3.3 Data Penelitian


Penelitian ini akan menggunakan dan menganalisa data sekunder, yaitu data
yang sudah tersedia bahkan sebelum penelitian dilakukan (Malhotra, 2012). Adapun
data sekunder ini merupakan data demografis, historis transaksi, dan konsumsi
pelanggan sebuah penyedia jasa layanan telekomunikasi yang dapat mengindikasikan
arah perilaku dan sifat dari pelanggan tersebut.
Penarikan data sekunder pelanggan penyedia jasa layanan telekomunikasi
kemudian akan disesuaikan dengan kebutuhan penelitian ini dengan mengacu kepada:
a. Data yang digunakan di dalam penelitian customer prediction modelling yang
sudah dilakukan sebelumnya di industri jasa layanan telekomunikasi atau sejenis
seperti yang dilakukan oleh Geetha et a. (2011), Svensen dan Prebensen (2011),
Li et al. (2015), dan Kim et al. (2017).
b. Mempertimbangkan untuk menggunakan data yang merepresentasikan faktor-
faktor yang berhubungan dan mempengaruhi customer churn yang sudah
diuraikan pada bab 2 seperti demografis, customer satisfaction, customer loyalty,
switching cost, serta customer bahavior yang terdiri atas perubahan perilaku beli
dan RFM (recency, frequency, dan monetary).

23
c. Berkompromi dengan keterbatasan data yang dapat di-crawling dan diotorisasi
oleh salah satu operator penyedia layanan telekomunikasi yang menjadi objek
penelitian ini.
d. Menyesuaikan dengan situasi dan trend terkini dari pola konsumsi dan
preferensi jenis produk atau layanan oleh pelanggan jasa sebagai salah satu
langkah pembaharuan studi yang sudah dilakukan sebelumnya.

3.4 Rancangan Sampel dan Prosedur


Secara umum dan kaidah statistik terkait dengan tingkatan kumpulan dari data
penelitian, akademisi mengenal istilah populasi dan sampel. Populasi adalah gabungan
seluruh elemen yang memiliki kesamaan rangkaian karakteristik yang mencakup
semesta objek yang menjadi kepentingan massalah penelitian (Malhotra, 2012) dan
sampel merupakan sebagian kecil dari populasi ini. Masih menurut Malhotra (2012),
sampel adalah bagian kelompok dari populasi yang dipilih untuk berpartisipasi di dalam
penelitian. Sampel yang dipilih sebagai bagian dari elemen populasi diharapkan paling
dapat mewakili atau menggambarkan karakteristik populasi.

3.4.1 Target Populasi Penelitian


Populasi sasaran adalah kumpulan dari elemen atau obyek yang memiliki
informasi yang dicari oleh peneliti. Malhotra (2012) menjabarkan populasi sasaran
sebagai kumpulan dari elemen atau objek penelitian yang memiliki informasi atau
karakterisitik yang dicari. Adapun informasi atau karakteristik ini harus dapat menjawab
masalah penelitian yang diuraikan pada bab 1. Khusus di dalam penelitian ini, elemen
atau obyek penelitian yang dimaksud adalah pelanggan penyedia jasa layanan
telekomunikasi.
Secara detail, penelitian ini akan berfokus terhadap pelanggan di salah satu penyedia
jasa layanan telekomunikasi terbesar di Indonesia dengan market share 59,2% di akhir
tahun 2018 (Pustlitbang Kominfo, 2018) yang masuk ke kategori churner maupun non
churner. Karakteritik populasi ini harus memenuhi ketentuan sebagai berikut:
a. Objek penelitian merupakan pelanggan dengan minimal lama berlangganan atau
LoS (length of stay) selam 3 bulan. Kriteria ini diadakan untuk menyesuaikan

24
dengan strategi perusahaan penyedia jasa layanan telekomunikasi “X” yang
melakukan segmentasi pelanggan dengan LoS lebih dari 3 bulan
b. Pelanggan berlangganan produk atau layanan prabayar, bukan pascabayar. Hal
ini dilakukan mengingat sebagian besar pelanggan pascabayar merupakan
corporate number atau yang berlangganan dikarenakan difasilitasi oleh
tempatnya bekerja dan sebagian merupakan child number atau yang
berlangganan karena difasilitasi oleh orang tua. Kedua pelanggan ini tentu tidak
memiliki freedom of choice untuk melakukan churn atau tidak.

3.4.2 Teknik Pengambilan Sampel


Pada dasarnya, teknik pengambilan sampel dapat dibagi menjadi 2 klasifikasi,
yaitu teknik non-probabilitas samping dan probabilitas sampling (Malhotra, 2012).
Teknik non-probabilitas sampling merupakan suatu teknik di mana peneliti dengan
bebas dan secara sadar memutuskan elemen apa saja yang masuk ke dalam penelitian.
Hal ini mengindikasikan kemungkinan atau peluang suatu elemen untuk terpilih
menjadi bagian dari sampel tidak diketahui. Teknik probabilitas sampling merupakan
suatu teknik di mana peneliti akan secara acak memilih elemen apa saja yang masuk ke
dalam penelitian. Artinya, setiap elemen mempunyai peluang yang sama untuk masuk
ke dalam anggota sampel penelitian. Gambar 3.2 secara jelas menguraikan klasifikasi
teknik sampling yang dapat dipilih untuk menentukan anggota sampel penelitian.

Gambar 3.2. Klasifikasi Teknik Sampling

25
Adapun penelitian ini akan menggunakan salah satu teknik probabilitas
sampling, yaitu cluster sampling. Teknik ini diadopsi mengingat elemen di dalam
penelitian ini terbagi menjadi 2 kelompok, yakni kelompok pelanggan yang melakukan
churn dan kelompok pelanggan yang tidak melakukan churn. Cluster sampling
memungkinkan pemilihan sampel berdasarkan teknik random sampling dari dua atau
lebih sub kelompok populasi yang dilakukan sebelumnya.

3.5 Variabel Penelitian


Umumnya pada penelitian deskriptif, variabel dibagi menjadi 2 kategori yaitu
variabel independen dan variabel dependen. Namun di dalam metode analisis statistik
untuk keperluan predictive modelling, variabel-variabel ini lebih dikenal dengan istilah
prediktor dan output biner.

3.5.1 Variabel Independen atau Prediktor


Variabel independen adalah variabel yang menerima treatment manipulasi di
dalam penelitian yang kemudian hasilnya diukur dan dibandingkan. Variabel ini
digunakan untuk menjelaskan terjadinya variabel dependen yang menjadi fokus
penelitian. Pada studi ini, variabel independen merupakan data demografis, historis
transaksi, dan konsumsi pelanggan sebuah penyedia jasa layanan telekomunikasi.
Variabel ini terdiri atas data yang bersifat numerikal dan ordinal.
Adapun data sekunder pelanggan yang akan digunakan telah disesuaikan untuk
mempresentasikan masing-masing variabel yang diadopsi dalam menjelaskan perilaku
pelanggan untuk melakukan churn atau tidak. Seperti yang telah dijabarkan di bab 2,
variabel atau prediktor seperti aspek demografis (Srinuan et al., 2011; Rambocas et
al.,2016), perilaku (Buckinx dan Poel, 2005; Geetha dan Kumari, 2011; Zorn et al.,
2010), service quality (Shafei dan Tabaa, 2015; Quach et al., 2015), customer
satisfaction (Keiningham et al, 2014), switching cost (Chuang dan Tei, 2015; Ram dan
Wu, 2015) dan customer loyalty (Shafei dan Tabaa, 2015) memiliki kontribusi atau
hubungan terhadap keputusan pelanggan melakukan churn atau bertahan dengan sebuah
penyedia jasa layanan telekomunikasi.
Untuk lebih jelasnya, tabel 3.1 telah menguraikan data sekunder pelanggan yang
akan dianalisa dalam studi ini.

26
Tabel 3.1. Independen Variabel yang Digunakan
Variabel Jenis Data Deskripsi Keterangan
FAKTOR DEMOGRAFIS
age Rasio umur pelanggan dalam tahun -
1= legacy (hanya 2G)
device_type Nominal jenis mobile device yang digunakan
2= modern device (3G ke atas)
CUSTOMER SATISFACTION
rata-rata skor kepuasan pelanggan
avg_ces_score Interval -
di 3 bulan terakhir
skor kepuasan pelanggan di kontak
end_ces_score Interval -
terakhir
SWITCHING COST
tingkat persaingan operator di lokasi
market_status Interval Menggunakan label kode 1 hingga 4
domisili pelanggan
CUSTOMER LOYALTY

los Rasio jumlah lama hari menjadi pelanggan -

0= kelas 1
kelas pelanggan dari teratas ke 1= kelas 2
segment_type Ordinal
terbawah 2= kelas 3
3= kelas 4
jumlah loyalty poin yang dimiliki
poin Rasio -
pelanggan
0= tidak menukarkan poin
redeemer_status Nominal pengguna loyalty point atau tidak
1= menukarkan poin
PERUBAHAN PERILAKU BELI (CHANGES IN BUYING BEHAVIOR)
%pertumbuhan transaksi pembelian
all_trx_growth Rasio -
3 bulan terakhir
%pertumbuhan total pendapatan
all_rev_growth Rasio -
nominal 3 bulan terakhir
%pertumbuhan pendapatan nominal
rev_dominant_growth Rasio kategori layanan dominan 3 bulan -
terakhir
RFM (RECENCY, FREQUENCY, MONETARY)
durasi hari sejak pembelian terakhir
recency Rasio -
yang dilakukan pelanggan
transaksi pembelian pada bulan
all_trx Rasio -
sebelumnya
total pendapatan nominal pada
all_rev Rasio -
bulan sebelumnya
pendapatan nominal kategori
rev_dominant Rasio layanan dominan pada bulan -
sebelumnya

3.5.2 Variabel Dependen


Variabel dependen adalah variabel yang diaplikasikan untuk mengukur dampak
yang ditimbulakan oleh variabel independen terhadap elemen penelitian. Variabel inilah
yang berusaha untuk dijelaskan oleh sebuah penelitian.
Adapun variabel dependen di penelitian ini merupakan keluaran yang bersifat
binary atau variabel kategorikal. Kelompok pelanggan yang melakukan churn dikoding
atau dilabel dengan angka 0 dan kelompok pelanggan yang tidak melakukan churn
dikoding atau dilabel dengan angka 1.

3.6 Sistematika Penelitian


Sistematika penelitian ini akan mengadopsi proses komputasi machine learning
yang disesuaikan untuk kebutuhan prediction modelling mengingat besarnya data yang

27
masuk ke dalam pengukuran. Alur sistematika penelitian diuraikan melalui gambar 3.3
berikut ini:

Gambar 3.3. Sistematika Penelitian yang Diolah Penulis

Tahapan pertama adalah pengambilan data sekunder pelanggan telekomunikasi


untuk beberapa kategori tertentu yang telah ditetapkan sesuai dengan studi eksplorasi
literatur yang dijabarkan pada bab 2. Kemudian, data tersebut akan dilakukan fine
tuning yang meliputi pengisian missing data menggunakan metode average assumption,
rebalancing data melalui dimensionality dan data reduction (Lin et al., 2014) untuk
meningkatkan kualitas serta relevansi data, membangun customer churn prediction
modelling dengan melakukan data training dari data set yang ditarik sebelumnya.
Kemudian, variabel independen (prediktor) dan variabel dependen kemudian diolah
menggunakan logistik regression mengingat variabel independen menggunakan data
yang bersifat numerikal dan kategorikal. Pada akhirnya, keakuratan model ini akan diuji
atau dibandingkan dengan metode lain, yaitu analisis diskriminan.
Pengolahan data penelitian pada fase model selection and training dan fase
eveluate and test model melibatkan pembagian data sekunder pelanggan ke 2 kelompok
pengolahan, yaitu training dataset dan test dataset. Adapun mekanisme proses
pegolahan data dan pengujian model ini secara detail dijabaran pada gambar 3.4 di
bawah ini.

28
Gambar 3.4. Machine Learning Discovery Model Building
Proses machine learning menggunakan regresi logistik terhadap data sekunder
pelanggan yang disusun ke beberapa faktor atau prediktor berdasarkan eksplorasi studi
ini diharapkan dapat secara kontinu diperbarui. Hal ini dapat dilakukan dengan
melakukan penggantian test dataset dan training dataset menggunakan data sekunder
pelanggan yang baru secara periodik. Proses kontinu ini bertujuan agar churn prediction
modelling yang dihasilkan dapat beradaptasi dan relevan dengan perilaku pelanggan
terkini.

3.7 Teknik Statistik


3.7.1 Analisis Regresi Logistik
Menurut Cizek dan Fitsgerald (1999), logistik regresi adalah alat analisis dasar
untuk mengukur hubungan yang:
a) Tidak memenuhi asumsi regresi linear
b) Dimodelkan secara terbaik melalui fungsi logit
c) Melibatkan satu atau lebih prediktor yang bersifat continuous dan categorical
serta variabel keluaran yang besifat dichotomous
Adapun persamaan regresi logistik yang diadopsi adalah persamaan dasar untuk
mengakomodasi model penelitian yang melibatkan multiple variable independen atau
prediktor seperti berikut:
Logit i=β 0 + β 1 X 1+ β 2 X 2 +…+ β k X k
atau
ln p
=β 0 + β 1 X 1 + β 2 X 2 +…+ β k X k
1− p
Dimana:
Logiti atau p/1-p = kemungkinan pelanggan melakukan churn atau tidak
ß0= koefisien konstanta
ßk= koefisien regresi variabel independen atau prediktor-k
Xk= nilai variabel dependen-k

3.7.2 Evaluasi Overall Model

29
Sebuah model logistik dapat dikatakan fit dengan data yang ada jika
menghasilkan perbaikan hasil dibandingkan dengan model intercept-only atau yang
biasa disebut dengan model null (Peng et al., 2002). Model intercept-only ini menjadi
tepat untuk dijadikan baseline karena tidak mengandung atau menggunakan prediktor.
Nilai perbaikan yang dihasilkan oleh model logistik terhadap baseline ini dapat diukur
menggunkan likelihood ratio, likelihood score, dan Uji Wald.

3.7.3 Uji Statistik Individual Prediktor


Signifikansi statistik dari setiap koefisien variabel independen atau prediktor
akan diukur menggunakan uji statistik Wald Chi-square. Jika nilai р-value dari masing-
masing prediktor menunjukkan nilai <0.05, maka prediktor tersebut dapat disimpulkan
kontributor signifikan dalam menentukan keputusan pelanggan untuk melakukan churn
atau tidak.

3.7.4 Uji Statistik Goodness-of-fit


Goodness-of-fit statistics dilakukan untuk menguji atau menilai apakah suatu model
logistik fit terhadap keluaran atau hasil aktual. Salah satu tes inferensial untuk
mengukur goodness-of-fit ini adalah tes Hosmer-Lemeshow (H-L). Jika р-value dari tes
ini menunjukkan nilai >0.05, maka model logistik dapat dikatakan fit dengan data yang
digunakan.

3.7.5 Validasi Predicted Probabilities


Karena pada dasarnya keluaran logit hasil dari suatu model logistik merupakan
natural log dari nilai peluang (probabilitas/(1-probabilitas), keluaran logit ini dapat
dikonversi kembali ke skala nilai probabilitas. Jadi, hasil dari nilai probabilitas hasil
konversi nilai keluaran logit dari model logistik dapat direvalidasi melalui perbandingan
dengan keluaran nilai probabilitas aktual. Tingkatan kesesuaian antara keluaran nilai
hasil prediksi suatu model logistik dengan nilai hasil aktual dapat dinyatakan ke dalam
pengukuran tabel asosiasi atau klasifikasi. Ada 4 pengukuran asosiasi tabel dan 1
pengukuran klasifikasi tabel yang dapat dilakukan. Pengukuran asosiasi tabel tersebut
adalah Kendall’s Tau-a, Goodman-Kruskal’s Gamma, Somer’s D Statistic, dan c
statistic.

30
31
BAB 4

ANALISIS DAN PEMBAHASAN

4.1 Sampel dan Variabel


Seperti yang telah dijabarkan pada bab sebelumnya, pemilihan data dari populasi
dilakukan dengan menggunakan metode cluster sampling. Kemudian, dalam
menentukan besaran sampel minimum, penelitian ini mengacu kepada dikemukakan
oleh Peduzzi et al. (1996) dengan formula sebagai berikut:

N=10 k / p smallest

di mana k merupakan jumlah prediktor atau variabel independen dan p smallest merupakan
persentase proporsi terkecil dari kategori 0 atau 1 populasi.
Karena jumlah prediktor atau variabel independen yang digunakan di dalam
studi ini berjumlah 16 dan proporsi pelanggan yang churn terhadap total populasi
pelanggan di bulan Februari sebesar 7.1%, maka jumlah sampel minimum yang
dibutuhkan adalah sebesar 2,253. Adapun, besaran sampel yang masuk ke dalam
observasi penelitian ini telah melewati batasan minimum tersebut, yaitu sebesar 3,097
sampel dengan rincian 1,099 sampel yang churn dan 1,098 sampel yang tidak churn.

4.2 Uji Beda Parametik dan Non Parametik


Untuk mengetahui signifikansi perbedaan dari 2 kelompok data atau sampel
pelanggan yang melakukan churn dan tidak, maka akan dilakukan uji beda
menggunakan metode independent sample t-test untuk sampel yang bersifat interval
atau rasio dan Mann-Whitnet U untuk sampel yang bersifat kategorikal.

32
Tabel 4.1. Hasil Uji Independent Sample T-Test
Levene's Test for
t-test for Equality of Means
Equality of Variances
Sig. (2- Mean Std. Error 95% Confidence
F Sig. t df
tailed) Difference Difference Lower Upper
Equal variances assumed 12.24 0.000 -1.10 3095.00 0.272 -0.49 0.45 -1.37 0.39
age
Equal variances not assumed -1.12 2411.11 0.262 -0.49 0.44 -1.35 0.37
Equal variances assumed 161.79 0.000 -12.57 3095.00 0.000 -656.34 52.22 -758.73 -553.96
los
Equal variances not assumed -14.52 3083.92 0.000 -656.34 45.22 -745.00 -567.68
Equal variances assumed 128.98 0.000 -14.11 3095.00 0.000 -55.61 3.94 -63.33 -47.88
poin
Equal variances not assumed -18.15 2537.05 0.000 -55.61 3.06 -61.61 -49.60
Equal variances assumed 86.29 0.000 -12.51 3095.00 0.000 (143,585) 11474.33 -166083 -121087
all_rev
Equal variances not assumed -15.98 2615.41 0.000 (143,585) 8985.76 -161205 -125965
Equal variances assumed 85.21 0.000 -8.71 3095.00 0.000 -196.76 22.60 -241.07 -152.45
all_trx
Equal variances not assumed -11.70 2043.32 0.000 -196.76 16.81 -229.73 -163.78
Equal variances assumed 119.58 0.000 -11.99 3095.00 0.000 -91962.27 7672.66 -107006 -76918.26
rev_dominant
Equal variances not assumed -15.80 2268.61 0.000 -91962.27 5821.23 -103378 -80546.78
Equal variances assumed 0.15 0.699 -0.87 3095.00 0.383 -1.17 1.34 -3.80 1.46
all_rev_growth
Equal variances not assumed -0.93 2725.40 0.351 -1.17 1.25 -3.63 1.29
Equal variances assumed 10.87 0.001 -2.66 3095.00 0.008 -1.98 0.75 -3.44 -0.52
all_trx_growth
Equal variances not assumed -3.57 2039.59 0.000 -1.98 0.55 -3.07 -0.89
rev_dominant_gro Equal variances assumed 7.51 0.006 -4.66 3095.00 0.000 -0.95 0.20 -1.35 -0.55
wth Equal variances not assumed -5.20 2963.61 0.000 -0.95 0.18 -1.31 -0.59
Equal variances assumed 862.84 0.000 133.13 3095.00 0.000 36.72 0.28 36.18 37.26
recency
Equal variances not assumed 113.19 1451.57 0.000 36.72 0.32 36.08 37.36
Equal variances assumed 50.14 0.000 -2.93 3095.00 0.003 -0.09 0.03 -0.16 -0.03
avg_ces
Equal variances not assumed -2.97 1788.61 0.007 -0.09 0.03 -0.16 -0.03

Seperti yang terlihat pada kolom Lavene’s Test for Equality of Variance,
prediktor age, los, poin all_rev, all_trx, al_rev_dominant, all_trx_growth,
rev_dominant_growth, recency, dan avg_ces menunjukkan p-value <0.05 sehingga H0
ditolak. Artinya, variance dari masing-masing prediktor tersebut antara kelompok
pelanggan churn dan tidak churn mempunyai perbedaan yang signifikan. Hanya
predikor all_rev_growth yang tidak mempunyai perbedaan variance signifikan antara
kedua kolompok sampelnya karena memiliki p-value sebesar 0.699. Kemudian, pada
kolom t-test for Equality of Means menunjukkan prediktor los, poin, all_rev, all_trx,
al_rev_dominant, all_trx_growth, rev_dominant_growth, recency, dan avg_ces
menunjukkan p-value <0.05 sehingga H0 ditolak. Artinya, nilai rata-rata dari masing-
masing prediktor ini mempunyai perbedaan signifikan antara kelompok sampel
pelanggan churn dan tidak churn. Sedangkan prediktor age dan all_rev_growth
mempunyai p-value masing-masing sebesar 0.262 dan 0.351 yang mengindikasikan
bahwa tidak ada perbedaan nilai rata-rata signifikan di antara kedua kelompok sampel.

33
Tabel 4.2. Hasil Uji Statistik Mann-Whitney U
market_status device_type segment_type reedemer_flag end_ces
Mann-Whitney U 1,062,744 1,069,299 550,873 601,787 1,047,638
Wilcoxon W 3,061,744 3,068,299 2,549,873 1,205,138 1,650,989
Z -1.644 -3.181 -25.203 -24.445 -3.608
Asymp. Sig. (2-tailed) 0.100 0.001 0.000 0.000 0.000

Hasil pengujian beda pada kelompok sampel yang bersifat kategorikal di atas
menunjukkan nilai p-value <0.05 untuk prediktor device_type, segment_type,
reedemer_flag, dan end_ces yang menolak H0. Artinya, prediktor-prediktor tersebut
menunjukkan perbedaan yang signifikan di antara kedua kelompok sampel pelanggan
churn dan tidak churn. Hanya prediktor market_status yang menunjukkan p-value 0.100
sehingga disimpulkan tidak adanya perbedaan dari prediktor ini di kedua kelompok
sampel.

4.3 Analisis Deskriptif


Statistik deskriptif digunakan untuk menganalisa data melalui deskripsi dan
penggambaran data yang dijadikan observasi. Seperti pada uji beda yang dilakukan pada
sub bab sebelumnya, untuk analisis statistik deskriptif ini juga dibagi menjadi 2
kelompok data atau sampel, yakni kelompok sampel yang bersifat interval atau rasio
dan kelompok data yang bersifat nominal atau ordinal (kategorikal).

34
Tabel 4.3. Analisis Deskriptif Variabel Interval dan Rasio
churn_status Mean Std. Deviation Std. Error Mean
Churn 35.24 11.305 0.341
age
No Churn 35.73 12.217 0.273
Churn 537.91 927.401 27.988
los
No Churn 1194.25 1587.841 35.514
Churn 20.03 36.610 1.105
poin
No Churn 75.64 127.721 2.857
Churn 36632.553 115168.0323 3475.6079
all_rev
No Churn 180217.157 370485.4277 8286.3779
Churn 40.82 59.142 1.785
all_trx
No Churn 237.58 747.470 16.718
Churn 17131.725 49456.5358 1492.5281
rev_dominant
No Churn 109093.997 251568.1596 5626.6419
Churn 291.3343% 3024.96248% 91.28908%
all_rev_growth
No Churn 408.3471% 3838.98528% 85.86379%
Churn -5.0738% 186.78006% 5.63676%
all_trx_growth
No Churn 192.9039% 2464.77797% 55.12789%
rev_dominant_gr Churn -17.2824% 408.97938% 12.34242%
owth No Churn 77.7708% 603.75084% 13.50366%
Churn 38.65 9.989 0.301
recency
No Churn 1.93 5.360 0.120
Churn 4.61 0.997 0.030
avg_ces
No Churn 4.70 0.749 0.017

Melihat hasil statistik deskriptif untuk kelompok data interval atau rasio yang
tercantum pada tabel 4.3, data dengan kategori non churn memiliki rata-rata nilai yang
secara signifikan lebih tinggi untuk predikor los, poin, all_rev, all_trx, rev_dominant,
all_rev_growth, all_trx_growth, recency, dan avg_ces jika dibandingkan dengan data
yang masuk ke dalam kategori churn.

Tabel 4.4. Analisis Deskriptif Variabel Kategorikal atau Nominal


churn_status Mean Rank Sum of Ranks
Churn 1580.61 1735509.00
market_status
No Churn 1531.64 3061744.00
Churn 1574.64 1728954.50
device_type
No Churn 1534.92 3068298.50
Churn 2046.79 2247380.00
segment_type
No Churn 1275.57 2549873.00
Churn 1097.58 1205138.00
reedemer_flag
No Churn 1796.96 3592115.00
Churn 1503.63 1650988.50
end_ces
No Churn 1573.92 3146264.50

35
Kemudian, hasil statistik deskripitif untuk data observasi yang bersifat nominal
atau ordinal yang tercantum pada tabel 4.4 mengindikasikan kelompok sampel yang
masuk ke kategori churn kecenderung memiliki lebih banyak data dengan device bertipe
smartphone, proporsi segmentasi pelanggan non prioritas yang lebih besar, penukar
loyalty poin, dan skor kepuasan pelanggan yang lebih tinggi.

4.4 Uji Multikoliniearitas


Tidak adanya efek multikolinieritas di antara prediktor adalah salah satu asumsi
yang harus dipenuhi sebelum melakukan proses regresi logistik. Untuk menguji
multikolinieritas dari prediktor yang akan digunakan, studi ini menggunakan uji
Pearson’s correlation.

Tabel 4.5. Hasil Korelasi antar Prediktor


rev_domi
rev_domi all_rev_gr all_trx_gr
age los poin all_rev all_trx nant_gro avg_ces recency
nant owth owth
wth
age 1.000 0.076 0.051 0.007 0.021 -0.023 -0.016 0.017 0.006 0.000 -0.032
los 0.076 1.000 0.061 0.097 0.053 0.107 -0.018 0.001 0.011 -0.001 -0.210
poin 0.051 0.061 1.000 0.534 0.189 0.512 -0.009 -0.003 0.013 -0.010 -0.259
all_rev 0.007 0.097 0.534 1.000 0.122 0.682 0.009 0.013 0.064 -0.045 -0.215
all_trx 0.021 0.053 0.189 0.122 1.000 0.093 -0.009 0.100 0.010 -0.011 -0.161
Pearson
rev_dominant -0.023 0.107 0.512 0.682 0.093 1.000 -0.017 -0.002 0.090 -0.034 -0.204
Correlation
all_rev_growth -0.016 -0.018 -0.009 0.009 -0.009 -0.017 1.000 0.042 0.330 0.015 -0.018
all_trx_growth 0.017 0.001 -0.003 0.013 0.100 -0.002 0.042 1.000 0.037 -0.008 -0.040
rev_dominant_growth 0.006 0.011 0.013 0.064 0.010 0.090 0.330 0.037 1.000 0.006 -0.078
avg_ces 0.000 -0.001 -0.010 -0.045 -0.011 -0.034 0.015 -0.008 0.006 1.000 -0.053
recency -0.032 -0.210 -0.259 -0.215 -0.161 -0.204 -0.018 -0.040 -0.078 -0.053 1.000

Tabel korelasi 4.5 di atas menunjukkan hasil analisis interkorelasi antara


masing-masing prediktor atau independen variabel yang ditandai dengan nilai koefisien
korelasi Pearson. Jika nilai koefisien korelasi Pearson menunjukkan nilai R<0.80, maka
bisa disimpulkan bahwa multikoliniearitas yang terjadi pada 2 predikor bersifat lemah
atau tidak kuat. Seperti yang terlihat pada tabel, tidak ada satupun skenario pasangan
prediktor memiliki nilai R>0.80.

36
Tabel 4.6. Hasil Koefisien Multikoliniearitas
Unstandardized Standardized 95.0% Confidence
t Sig. Correlations Collinearity Statistics
Coefficients Coefficients Interval for B
B Std. Error Beta Lower Upper Zero-order Partial Part Tolerance VIF
(Constant) 0.976 0.022 44.935 0.000 0.934 1.019
age 0.000 0.000 -0.011 -1.629 0.103 -0.001 0.000 0.020 -0.029 -0.011 0.985 1.015
los 9.236E-06 0.000 0.028 3.872 0.000 0.000 0.000 0.220 0.070 0.027 0.945 1.059
poin -1.706E-05 0.000 -0.004 -0.457 0.647 0.000 0.000 0.246 -0.008 -0.003 0.670 1.493
all_rev 1.574E-08 0.000 0.010 0.684 0.494 0.000 0.000 0.219 0.012 0.005 0.210 4.762
all_trx 2.694E-06 0.000 0.003 0.481 0.631 0.000 0.000 0.155 0.009 0.003 0.938 1.066
rev_dominant 2.935E-08 0.000 0.013 0.860 0.390 0.000 0.000 0.211 0.015 0.006 0.215 4.658
all_rev_growth -6.265E-07 0.000 -0.005 -0.637 0.524 0.000 0.000 0.016 -0.011 -0.004 0.883 1.132
all_trx_growth 2.499E-06 0.000 0.010 1.491 0.136 0.000 0.000 0.048 0.027 0.010 0.985 1.015
rev_dominant_growth 1.003E-05 0.000 0.011 1.546 0.122 0.000 0.000 0.084 0.028 0.011 0.874 1.144
avg_ces 0.003 0.004 0.005 0.786 0.432 -0.005 0.011 0.052 0.014 0.005 0.993 1.007
recency -0.023 0.000 -0.911 -123.091 0.000 -0.023 -0.023 -0.923 -0.912 -0.850 0.870 1.150

Selanjutnya, dilakukan analisis tambahan terhadap nilai yang ada di dalam


kolom unstandardized coefficient dan collinearity statistics pada tabel 4.6 huntuk
memastikan tidak adanya multikoliniearitas dengan lebih mendalam. Di semua
prediktor atau variabel independen, nilai standar error dan koefisien beta secara selaras
menunjukkan nilai <1.00. Dapat diartikan bahwa prediktor yang digunakan memiliki
nilai standar eror yang rendah dan tidak terdeteksi adanya multikoliniearitas. Analisa
dilanjutkan ke nilai Tolerance dan nilai VIF yang digunakan sebagai indikasi terjadinya
fenomena interkorelasi antar prediktor atau tidak. Semua prediktor mempunyai nilai
Tolerance >0.20 dan nilai VIF <10. Artinya, dapat disimpulkan dengan tegas bahwa
tidak terdapat masalah multikoliniearitas.

4.5 Analisis dan Diskusi Hasil Pengujian Hipotesis


4.5.1 Uji Pengaruh Demografis
Model pertama terdiri atas prediktor atau variabel demografis, seperti umur 
age dan mobile device yang digunakan oleh pelanggan  device_type. Predikor age
menggunakan skala rasio sedangkan predikor device_type menggunakan skala nominal.

Tabel 4.7. Uji Chi-square Prediktor Demografis


Chi-square df Sig.
Step 11.564 2 0.003
Step 1 Block 11.564 2 0.003
Model 11.564 2 0.003

Nilai yang tertera pada tabel 4.7 menunjukkan hasil tes menyeluruh terhadap model
yang melibatkan prediktor-prediktor terpilih. Nilai chi-square 11.564 dengan p-value

37
<0.05 menandakan bahwa model yang diuji secara signifikan lebih baik dan fit
dibandingkan model kosong atau model yang tidak menyertakan prediktor satupun dan
demikian turut menolak H0.

Tabel 4.8. Uji Nagelkerke R Square Prediktor Demografis


-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
4015.836a 0.004 0.005

Kemudian, tabel 4.8 menunjukkan informasi model fit secara keseluruhan yang
memuat nilai koefisien Cox & Snell R Square dan Nagelkerke R Square. Pada dasarnya,
kedua nilai koefisien ini merupakan hasil dari percobaan untuk mensimulasikan R
square dari regresi linear namun dalam konteks binary outcome. Nilai koefisien Cox &
Snell R Square biasanya memiliki besaran maksimal <1.00, sehingga menjadi sulit
untuk menginterpretasikannya dengan R square. Oleh karena itu, nilai koefisien
Nagelkerke R Square yang merupakan modifikasi lanjutan dari Cox & Snell R Square
menjadi referensi yang lebih sering digunakan dalam analisis.
Nilai koefisien Nagelkerke R Square di model pertama ini menunjukkan nilai
0.005. Artinya, kemampuan prediktor demografis dalam menjelaskan keluaran nilai
variabel dependen hanya sebesar 0.5%.

Tabel 4.9. Uji Persamaan Regresi Logistik Prediktor Demografis


95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
age 0.003 0.003 0.778 1 0.378 1.003 0.997 1.009
device_type(1) -0.607 0.197 9.466 1 0.002 0.545 0.370 0.802
Constant 1.080 0.229 22.142 1 0.000 2.944

Tabel 4.8 memperlihatkan nilai koefisien, standard error, uji tes Wald dengan
asosiasi degree of freedom dan p-value, serta exponentiated coefficient atau yang biasa
disebut dengan odds ratio. P-value dari predikor device_type yang menunjukkan nilai
<0.05 yang mengindikasikan predikor ini signifikan dalam mempengaruhi pelanggan
churn atau tidak. Dengan hasil ini, maka hipotesis penelitian H1a ditolak sedangkan
hipotesis penelitian H1b diterima. Nilai koefisien regresi sebesar -0.607 menunjukan

38
bahwa pelanggan yang menggunakan modern device akan menurunkan log odds
pelanggan untuk bertahan

4.5.2 Uji Pengaruh Customer Satisfaction


Model kedua terdiri atas prediktor atau variabel customer satisfaction, seperti
rata-rata nilai kepuasan pelanggan  avg_ces dan niali akhir kepuasan pelanggan 
end_ces. Predikor avg_ces menggunakan skala r sedangkan predikor end_ces
menggunakan skala ordinal.

Tabel 4.10. Uji Chi-square Prediktor Customer Satisfaction


Chi-square df Sig.
Step 9.151 2 0.010
Step 1 Block 9.151 2 0.010
Model 9.151 2 0.010

Pada tabel 4.10 memperlihatkan milai chi-square 1,215.9 dengan p-value <0.05 yang
menandakan bahwa model yang diuji secara signifikan lebih baik dan fit dibandingkan
model kosong atau model yang tidak menyertakan prediktor dan dengan demikian turut
menolak H0.

Tabel 4.11. Uji Nagelkerke R-square Prediktor Customer Satisfaction


-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
4018.249a 0.003 0.004

Kemudian, tabel 4.11 di atas mencantumkan koefisien Nagelkerke R Square di


model kedua ini yang menunjukkan nilai 0.004. Artinya, kemampuan prediktor
customer satisfaction dalam menjelaskan keluaran nilai variabel dependen hanya
sebesar 0.4%.

Tabel 4.12. Uji Persamaan Regresi Logistik Prediktor Customer Satisfaction


95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
avg_ces 0.062 0.082 0.567 1 0.451 1.064 0.906 1.249
end_ces 0.066 0.072 0.837 1 0.360 1.068 0.928 1.230
Constant 0.005 0.204 0.001 1 0.981 1.005

39
Tabel 4.12 memperlihatkan p-value dari kedua predikor avg_ces dan end_ces
menunjukkan nilai <0.05 yang mengindikasikan bahwa prediktor customer satisfaction
tidak mempunyai pengaruh signifikan terhadap keluaran nilai variabel dependen
customer churn. Dengan demikian, maka H0 diterima dan masing-masing hipotesis
penelitian H2a dan H2b ditolak.

4.5.3 Uji Pengaruh Switching Cost


Model ketiga terdiri atas prediktor atau variabel switchig cost, yaitu tingkat
persaingan operator jasa layanan telekomunikasi di tempat domisili pelanggan 
market_status. Predikor market_status menggunakan skala ordinal.

Tabel 4.13. Uji Chi-Squre Prediktor Switching Cost


Chi-square df Sig.
Step 5.375 1 0.020
Step 1 Block 5.375 1 0.020
Model 5.375 1 0.020

Pada tabel 4.13 memperlihatkan milai chi-square 5.373 dengan p-value <0.05
yang menandakan bahwa model yang diuji secara signifikan lebih baik dan fit
dibandingka dengan model kosong atau model yang tidak menyertakan prediktor dan
dengan demikian menolak H0.

Tabel 4.14. Uji Nagelkerke R-square Prediktor Switching Cost


-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
4022.025a 0.002 0.002

Kemudian, tabel 4.14 di atas mencantumkan koefisien Nagelkerke R Square di


model kedua ini yang menunjukkan nilai 0.002. Artinya, kemampuan prediktor
switching cost dalam menjelaskan keluaran nilai variabel dependen hanya sebesar 0.2%.

Tabel 4.15. Uji Persamaan Regresi Logistik Prediktor Switching Cost

40
95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
market_status -0.078 0.034 5.411 1 0.020 0.925 0.866 0.988
Constant 0.740 0.072 106.854 1 0.000 2.096

Tabel 4.15 memperlihatkan p-value dari predikor market_status menunjukkan


nilai <0.05 yang mengindikasikan bahwa variabel switching cost signifikan dalam
mempengaruhi variabel dependen pelanggan churn atau tidak. Dengan demikian, maka
H0 ditolak dan hipotesis penelitian H3 diterima.
Hasil pengujian yang menerima hipotesis variabel switching cost ini sejalan
dengan beberapa temuan studi yang sudah dilakukan sebelumnya (Chuang dan Tai,
2015; Srinuan et al., 2011). Nilai koefisien regresi sebesar -0.078 menunjukan semakin
meningkatnya persaingan antar operator telekomunikasi atau tergerusnya market share
sebuah operator telekomunikasi di suatu kota, maka semakin kecil nilai log odds
pelanggan untuk bertahan.

4.5.4 Uji Pengaruh Customer Loyalty


Model keempat terdiri atas prediktor atau variabel customer loyalty, tipe
segmentasi pelanggan  segment_type, jumlah loyalty poin yang dimiki oleh
pelanggan  poin, dan keikutsertaan pelanggan dalam loyalty program 
redeemer_status. Adapun prediktor segment_type dan redeemer_status menggunakan
skala kategorikal sedangan poin menggunakan skala numerikal atau rasio.

Tabel 4.16. Uji Chi-square Prediktor Customer Loyalty


Chi-square df Sig.
Step 1100.741 4 0.000
Step 1 Block 1100.741 4 0.000
Model 1100.741 4 0.000

Pada tabel 4.16 memperlihatkan milai chi-square 1,100.7 dengan p-value <0.05 yang
menandakan bahwa model yang diuji secara signifikan lebih baik dan fit dibandingkan
model kosong atau model yang tidak menyertakan prediktor dan dengan demikian turut
menolak H0.

41
Tabel 4.17. Uji Nagelkerke R-square Prediktor Customer Loyalty
-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
2926.659a 0.299 0.411

Kemudian, tabel 4.17 di atas mencantumkan koefisien Nagelkerke R Square di


model ketiga ini yang menunjukkan nilai 0.411. Artinya, kemampuan variabel
independen dalam menjelaskan keluaran nilai variabel dependen adalah sebesar 41.1%.

Tabel 4.18. Uji Persamaan Regresi Logistik Prediktor Customer Loyalty


95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
los 0.000 0.000 72.647 1 0.000 1.000 1.000 1.001
segment_type -0.819 0.098 69.210 1 0.000 0.441 0.363 0.535
poin 0.013 0.002 67.225 1 0.000 1.013 1.010 1.016
reedemer_flag(1) 1.209 0.095 161.100 1 0.000 3.351 2.780 4.038
Constant 1.961 0.395 24.583 1 0.000 7.106

Tabel 4.19 memperlihatkan p-value dari predikor los, segment_type, poin, dan
redeemer_status menunjukkan nilai <0.05 yang mengindikasikan variabel-variabel ini
signifikan mempengaruhi keluaran variabel depeden pelanggan churn atau tidak..
Dengan demikian, maka H0 ditolak dan hipotesis penelitian H4a, H4b, H4c, dan H4d
diterima. Nilai koefisien regresi +0.00 untuk prediktor los dan +0.013 untuk prediktor
poin menunjukkan bahwa semakin lama menjadi pelanggan dan atau semakin banyak
memiliki loyalty poin, maka nilai log odds pelanggan untuk bertahan meningkat.
Kemudian, pelanggan yang berada di segmentasi lebih tinggi dan mengikuti loyalty
program turut menaikkan nilai log odds pelanggan untuk tidak melakukan churn.

4.5.5 Uji Pengaruh Perubahan Perilaku Beli


Model kelima terdiri atas prediktor atau variabel perubahan perilaku beli, seperti
durasi hari semenjak pembelian terakhir dilakukan  recency, jumlah transaksi terakhir
pelanggan  all_trx, jumlah nominal revenue terakhir pelanggan  all_rev, dan
jumlah nominal revenue terakhir pelanggan di kategori produk dominan 
rev_dominant. Adapun keempat prediktor ini menggunakan skala numerikal atau rasio.

Tabel 4.19. Uji Chi-square Prediktor Perubahan Perilaku Beli

42
Chi-square df Sig.
Step 141.774 3 0.000
Step 1 Block 141.774 3 0.000
Model 141.774 3 0.000

Pada tabel 4.19 memperlihatkan milai chi-square 141.7 dengan p-value <0.05 yang
menandakan bahwa model yang diuji secara signifikan lebih baik dan fit dibandingkan
model kosong atau model yang tidak menyertakan prediktor dan dengan demikian turut
menolak H0.

Tabel 4.20. Uji Nagelkerke R-square Prediktor Perubahan Perilaku Beli


-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
3885.626a 0.045 0.061

Kemudian, tabel 4.20 di atas mencantumkan koefisien Nagelkerke R Square di


model ketiga ini yang menunjukkan nilai 0.061. Artinya, kemampuan variabel
independen dalam menjelaskan keluaran nilai variabel dependen adalah sebesar 6.1%.

Tabel 4.21. Uji Persamaan Regresi Logistik Prediktor Perubahan Perilaku Beli
95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
all_rev_growth 0.000 0.000 0.984 1 0.321 1.000 1.000 1.000
all_trx_growth 0.002 0.000 42.046 1 0.000 1.002 1.002 1.003
rev_dominant_growth 0.001 0.000 18.008 1 0.000 1.001 1.001 1.002
Constant 0.543 0.038 199.190 1 0.000 1.721

Tabel 4.21 memperlihatkan hanya p-value dari predikor all_trx_growth dan


rev_dominant_growth menunjukkan nilai <0.05 yang mengindikasikan variabel-
variabel ini signifikan mempengaruhi keluaran variabel depeden pelanggan churn atau
tidak. Sedangkan p-value dari prediktor all_rev_growth sebesar 0.321>0.05 yang
menjelaskan bahwa pengaruh yang dimiliki tidak signifikan terhadap variabel dependen.
Dengan demikian, hipotesis penelitian H5b dan H5c diterima sedangkan hipotesis
penelitian H5a ditolak. Nilai koefisien regresi +0.002 untuk prediktor all_trx_growth
dan +0.001 untuk prediktor rev_dominant_growth mengindikasikan semakin naiknya
transaksi dan atau bertambahnya pendapatan dari kategori produk dominan menaikkan
log odds pelanggan untuk bertahan.

43
4.5.6 Uji Pengaruh Recency, Frequency, dan Monetary
Model keenam terdiri atas prediktor atau variabel recency, frequency, dan
monetary (RFM) seperti pergerakan jumlah transaksi pelanggan  all_trx_growth,
pergerakan nominal revenue pelanggan  all_rev_growth, dan pergerakan nominal
revenue pelanggan di kategori produk dominan  rev_dominant_growth. Adapun
ketiga prediktor ini menggunakan skala numerikal.

Tabel 4.22. Uji Chi-square Prediktor RFM


Chi-square df Sig.
Step 3705.753 4 0.000
Step 1 Block 3705.753 4 0.000
Model 3705.753 4 0.000

Pada tabel 4.22 memperlihatkan milai chi-square 3,705.7 dengan p-value <0.05 yang
menandakan bahwa model yang diuji secara signifikan lebih baik dan fit dibandingkan
model kosong atau model yang tidak menyertakan prediktor dan dengan demikian turut
menolak H0.

Tabel 4.23. Uji Nagelkerke R-square Prediktor RFM


-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
321.646a 0.698 0.959

Kemudian, tabel 4.23 di atas mencantumkan koefisien Nagelkerke R Square di


model ketiga ini yang menunjukkan nilai 0.969. Artinya, kemampuan variabel
independen dalam menjelaskan keluaran nilai variabel dependen adalah sebesar 96.9%.

Tabel 4.24. Uji Persamaan Regresi Logistik Prediktor RFM


95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
all_rev 0.000 0.000 2.202 1 0.138 1.000 1.000 1.000
all_trx 0.000 0.000 0.096 1 0.757 1.000 0.999 1.001
rev_dominant 0.000 0.000 14.952 1 0.000 1.000 1.000 1.000
recency -0.346 0.024 202.649 1 0.000 0.707 0.674 0.742
Constant 7.402 0.682 117.622 1 0.000 1638.574

44
Tabel 4.24 memperlihatkan hanya p-value dari predikor rev_dominant dan
recency menunjukkan nilai <0.05 yang mengindikasikan variabel-variabel ini signifikan
mempengaruhi keluaran variabel depeden pelanggan churn atau tidak. Sedangkan p-
value dari prediktor all_rev dan all_trx masing-masing sebesar 0.138>0.05 dab
0.757>0.05 yang menjelaskan bahwa pengaruh yang dimiliki tidak signifikan terhadap
variabel dependen. Dengan demikian, hipotesis penelitian H6a dan H6d diterima
sedangkan hipotesis penelitian H6b dan H6c ditolak. Nilai koefisien regresi yang
menunjukkan nilai -0.364 mengindikasikan semakin lama durasi hari semenjak
transaksi pembelian terakhir yang dilakukan pelanggan turut menurunkan log odds
pelanggan untuk bertahan.

4.5.7 Hasil Pengujian Permodelan Prediksi Pelanggan Churn


Pada pengujian model terakhir ini, semua 16 prediktor dari data sekunder
pelanggan dimasukkan ke dalam data training menggunakan metode regresi logistik
untuk menemukan churn prediction modelling.

Tabel 4.25. Uji Chi-square Semua Predikor


Chi-square df Sig.
Step 3722.628 16 0.000
Step 1 Block 3722.628 16 0.000
Model 3722.628 16 0.000

Pada tabel 4.25 memperlihatkan milai chi-square 3,722.9 dengan p-value <0.05 yang
menandakan bahwa model yang diuji secara signifikan lebih baik dan fit dibandingkan
model kosong atau model yang tidak menyertakan prediktor satupun dan demikian turut
menolak H0.

Tabel 4.26. Uji Nagelkerke R-square Semua Prediktor


-2 Log likelihood Cox & Snell R Square Nagelkerke R Square
Step 1
304.772a 0.699 0.961

Kemudian, tabel 4.26 di atas mencantumkan koefisien Nagelkerke R Square di


model terakhir ini yang menunjukkan nilai 0.961. Artinya, kemampuan variabel
independen dalam menjelaskan keluaran nilai variabel dependen adalah sebesar 96.1%.

45
Komposisi variabel independen pada model ini memiliki kemampuan menjelaskan
variabel dependen lebih bak dibandingkan dengan model-model sebelumnya.

Tabel 4.27. Uji Hosmer and Lemeshow Semua Prediktor


Step Chi-square df Sig.
1 1.286 3 0.732

Hosmer and Lemshow dilakukan untuk menguji Goodness of Fit, atau


menentukan apakah model akhir yang dibentuk di dalam penelitian ini sudah tepat atau
tidak. Suatu model dapat dikatakan memiliki Goodness of Fit yang baik apabila tidak
ada perbedaan signifikan antara model dan nilai observasinya. Nilai signifikansi dari
model ini adalah 0.732<0.05, artinya H0 diterima dan model regresi logistik dapat
disimpulkan tidak memiliki perbedaan antara model dan nilai observasinya.

Tabel 4.27. Hasil Klasifikasi Semua Prediktor


Predicted
Percentage
churn_status
Correct
Observed Churn No Churn
Churn 1098 0 100.0
churn_status
No Churn 29 1970 98.5
Overall Percentage 99.1

Dengan menggabungkan dan memasukan 16 prediktor atau variabel independen


yang terdiri atas age, los, market_status, device_type, segment_type, poin,
redeemer_status, all_revenue, all_trx, rev_dominant, all_rev_growth, all_trx_growth,
dan rev_dominant_growth, dan recenct ke dalam model, hasilnya menunjukkan
ketepatan prediksi model ini sebesar 99.1% secara keseluruhan. Adapun secara lebih
detail, ketepatan model dalam memprediksikan pelanggan yang churn sebesar 100%
dan memprediksikan pelanggan yang bertahan sebesar 98.5%.

46
Tabel 4.28. Uji Persamaan Regresi Logistik Semua Prediktor
95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
age -0.004 0.015 0.064 1 0.801 0.996 0.968 1.025
los 0.000 0.000 0.008 1 0.927 1.000 1.000 1.000
market_status -0.162 0.155 1.089 1 0.297 0.851 0.628 1.152
device_type(1) -1.234 0.995 1.540 1 0.215 0.291 0.041 2.044
segment_type 0.059 0.318 0.034 1 0.854 1.060 0.568 1.979
poin 0.002 0.004 0.215 1 0.643 1.002 0.994 1.010
reedemer_flag(1) 0.935 0.375 6.225 1 0.013 2.547 1.222 5.309
all_rev 0.000 0.000 2.184 1 0.139 1.000 1.000 1.000
all_trx 0.000 0.000 0.495 1 0.482 1.000 0.999 1.000
rev_dominant 0.000 0.000 8.409 1 0.004 1.000 1.000 1.000
all_rev_growth 0.000 0.000 3.094 1 0.079 1.000 1.000 1.000
all_trx_growth 0.001 0.001 1.377 1 0.241 1.001 1.000 1.002
rev_dominant_growth 0.000 0.000 5.651 1 0.017 1.000 1.000 1.001
avg_ces 0.345 0.485 0.507 1 0.477 1.412 0.546 3.650
end_ces -0.158 0.450 0.123 1 0.726 0.854 0.354 2.063
recency -0.346 0.025 191.618 1 0.000 0.707 0.674 0.743
Constant 7.252 2.096 11.976 1 0.001 1410.574
Final Logit Function:
ܻ
‫݊ܮ‬ ൌ
͹Ǥʹ ͷʹ ൅ ͲǤͻ͵ ͷܺௗ
௥௘ௗ௘௘௠ ௘௥ ୀଵ ൅ ͲǤ
ͲͲܺ௥௘௩̴ ௗ௧௢௠ ௜௡௔௡ ௧ ൅ ͲǤͲͲܺ௥௘௩̴ ௗ௧௢௠ ௜௡௔௡௧̴ ௚௥௢௪ ௧௛ െͲǤ͵ Ͷ͸ܺ௥௘௖௘௡௖௬
ͳ െܻ

Tabel 4.28 memperlihatkan p-value dari predikor los, segment_type,


loyalty_poin, redeemer_status, all_trx, dan rev_dominan, dan all_trx_growth
menunjukkan nilai <0.05 yang mengindikasikan variabel-variabel ini signifikan.
Dengan demikian, maka model regresi logistik terbentuk atas koefisien dan prediktor
redeemer_flag, rev_dominant, rev_dominant growth, dan recency.
Setelah melakukan finaisasi customer churn prediksi modelling menggunakan
regresi logistik, selanjutnya model ini disimulasikan menggunakan data sekunder
43,064 pelanggan di bulan Maret 2020. Hasilnya menunjukkan bahwa model akhir ini
menghasilkan akurasi prediksi keluruhan sebesar 97.3% dengan rincian 97.1% akurasi
dalam memprediksikan pelanggan yang tidak churn dan 99.8% akurasi dalam
memprediksikan pelanggan yang churn.

47
BAB 5

KESIMPULAN

5.1 Diskusi dan Kesimpulan


Variabel atau prediktor customer loyalty dan RFM (recency, frequency, dan
monetary) memiliki nilai Nagelkerke R-square tinggi serta memenuhi treshold nilai
signifikansi, sehingga dapat disimpulkan bahwa perilaku pelanggan untuk churn atau
tidak dapat dijelaskan dengan baik dan dipengaruhi secara signifikan oleh 2 kelompok
prediktor ini. Hasil penelitian terhadap pengaruh customer loyalty salah satunya
memperkuat temuan Zeithaml et al. (2001) dan Xiong et al. (2013). Semakin tinggi
segmentasi atau kelas pelanggan, maka semakin kecil peluang atau probabilitasnya
untuk melakukan churn. Di samping itu, pelanggan yang bergabung dan mengambil
manfaat dari loyalty program menjadi salah satu indikasi yang signifikan bahwa
pelanggan ini akan bertahan. Temuan ini secara langsung memberikan tambahan
validasi terhadap studi yang dilakukan oleh Greenberg (2006). Selanjutnya, beberapa
variabel RFM dinilai signifikan dalam mempengaruhi perilaku pelanggan churn
memperkuat kesimpulan yang studi terdahulu bahwa variabel RFM adalah prediktor
terbaik alam membedakan pelanggan yang loyal dan non loyal (Dursun dan Caber,
2016). Meskipun demikian, variabel RFM lainnya seperti jumlah transaksi dan total
nominal revenue terakhir tidak memiliki perngaruh signifikan, bertolak belakang
dengan permodelan prediksi dari Shapoval dan Setzer (2017) yang menitikberatkan
figur data transakai dan nominal revenue terakhir. Temuan yang saling berlawanan ini
dapat dijelaskan oleh fenomena price-changing plan yang banyak diterapkan oleh
operator jasa layanan telekomunikasi (Zorn et al., 2010). Perubahan harga yang cepat
dan tercampurnya nominal revenue dengan aktivasi produk sekunder yang dilakukan
dengan tidak teratur membuat pergerakan total nominal revenue menjadi redundan.
Fenomena ini juga berdampak kepada pengaruh hubungan perubahan perilaku beli
terhadap perilaku churn yang tidak signifikan untuk beberapa variabel seperti
pertumbuhan transaksi dan total nominal revenue pelanggan.
Berpindah ke faktor selanjutnya, hasil pengujian yang menerima hipotesis
variabel switching cost sejalan dengan beberapa temuan studi yang sudah dilakukan
sebelumnya (Chuang dan Tai, 2015; Srinuan et al., 2011). Semakin rendah switching

48
cost yang dihadapi pelanggan dikarenakan semakin lemahnya dominasi market share
suatu operator layanan telekomunikasi, maka probabilitas pelanggan untuk melakukan
churn meningkat. Berikutnya dengan melihat karakteristik demografis, tidak
signifikannya pengaruh umur tehadap perilaku churn bertolak berlakang dengan studi
yang dilakukan oleh Srinuan et al. (2011). Temuan ini sebenarnya sudah mulai terlihat
pada hasil uji beda yang menunjukan tidak adanya perbedaan nilai rata-rata signifikan di
antara 2 kelompok sampel churn dan tidak churn. Langkah operator telekomunikasi
yang menjadi subjek penelitian dalam meluncurkan produk berbeda berdasarkan
kelompok umur dengan perbedaan komposisi offering layanan menjadi salah satu alasan
pengaruh lemah prediktor ini. Meskipun demikian, mobile device yang menjadi variabel
demografis launnya menunjukkan pengaruh yang signifikan. Hasil pengujian tersbut
selaras dengan studi yang dilakukan Shen (2015) bahwa pengguna smartphone
cenderung memiliki life-cycle pengunaan mobile device yang pendek.
Pada bagian terakhir diskusi ini, hanya ada sebuah faktor yang tidak satupun
variabelnya menunjukkan pengaruh signifikan terhadap perilaku churn pelanggan, yaitu
customer satisfaction. Hasil pengujian yang menolak kedua hipotesis variabel customer
satisfaction dapat dijelaskan oleh scoping pengukuran skor kepuasan pelanggan yang
diadopsi di dalam penelitian ini. Pada dasarnya customer satisfaction terbagi ke 2 basis,
yakni berbasis kumulatif dan transaksi (Kuo et al., 2009). Ada kemungkinan bahwa
pengukuran customer satisfaction dengan basis transaksi yang digunakan pada
penelitian ini kurang representatif dalam konteks menjelaskan outcome pelanggan
churn.

5.2 Implikasi Manajerial


Berdasarkan rumusan masalah dan pembahasan hasil penelitian ini, maka
selanjutnya pada bagian ini akan dipaparkan beberapa hal yang dapat menjadi titik
fokus bagi praktisi, menajerial, atau eksekutif di operator layanan telekomunikasi yang
di antaranya dijabarkan sebagai berikut:
1. Mengingat besarnya pengaruh dan kemampuan variabel recency, frequency, dan
monetary (RFM) dalam menjelaskan perilaku churn pelanggan, praktisi operator
telekomunikasi dapat membangun strategi customer relationship management
dan melakukan cascading intensitas action plan terhadap pelanggan berdasarkan

49
durasi waktu jeda dan tingkat profitabilitas dari transaksi pembelian terakhir
yang dilakukan oleh pelanggan.
2. Strategi customer retention melalui skema loyalty program atau loyalty
membership menjadi hal yang krusial untuk mencegah pelanggan churn. Demi
menghadirkan competitive advantage terhadap program sejenis yang dimiliki
oleh kompetitor, praktisi operator jasa layanan telekomunikasi dapat bekerja
sama dengan aggregator loyalty poin untuk dapat memberikan loyalty program
yang terintegrasi dengan perusahaan atau brand lain, bahkan lintas industri.

5.3 Implikasi Teoritis


Terdapat 2 hal yang menjadi perhatian khusus dalam hasil penelitian ini di
dalam konteks kontribusinya terhadap paradigma teori yang ada, di antaranya:
1. Meskipun variabel customer satisfaction memiliki hubungan secara langsung
atau tidak langsung terhadap keputusan pelanggan untuk churn atau tidak, akan
tetapi pengujian menggunakan model 2 mengindikasikan temuan yang
berlawanan. Mengingat variabel customer satisfaction yang digunakan
merupakan representasi dari kepuasan pelanggan terhadap kualitas customer
touch pon, maka perlu adanya penelitian lebih lanjut mengenai kepuasan
pelanggan terhadap jenis atribut operator layanan telekomunikasi yang secara
signifikan berpengaruh terhadap perilaku churn pelanggan.
2. Perubahan buying behavior atau perilaku membeli melalui pengukuran tren
pertumbuhan jumlah transaksi dan kontribusi pendapatan dalam satuan range
waktu dinilai signifikan dalam mempengaruhi keputusan pelanggan untuk churn.
Hal ini menjadi katalis terhadap churn prediction modelling di banyak studi
mainstream sebelumnya yang hanya mengadopsi variabel di satu titik waktu
(Ganesh et al., 2000).

5.5 Keterbatasan Penelitian


Penelitian ini memiliki berbagai limitasi sehingga untuk penelitian selanjutnya dapat
melakukan pembaharuan sebagi berikut:
1. Penelitian ini hanya mencakup populasi pelanggan di sebuah operator
telekomunikasi Indoensia yang sudah menjadi market leader selama bertahun-

50
tahun. Guna menghadirkan kajian yang lebih komprehensif, maka penelitian
selanjutnya perlu memasukkan sampel observasi yang berasal dari populasi
pelanggan di sebuah operator telekomunikasi non market leader atau berada di
luar kawasan Indonesia.
2. Jika penelitian berikutnya ingin mengadopsi dataset dengan skala yang jauh
lebih besar, maka data pre-processing melalui metode dimensionality reduction
(feature selection) dan data reduction (Lin et al., 2014) dapat dilakukan untuk
menghasilkan proses data training yang lebih efisien.
3. Untuk melakukan enrichment terhadap penelitian sejenis, akademisi dapat
mengadopsi studi kualitatif yang bertindak sebagi pelengkap terhadap studi
utama seperti metode in-depth interview ataupun metode FGD (focus group
discussion).

51
DAFTAR PUSTAKA

Afidah, A. N., & Doom, M. (2019). Laporan Tahunan 2018. Jakarta: Kementrian
Komunikasi dan Informatika.
Bahla, C., & Suardi, S. (2019). The State of Mobile Internet Connectivity. London:
GSMA Intelligence.
Chuah, S. H.-W., Rauschnabel, P. A., Marimuthu, M., Thurasamy, R., & Nguyen, B.
(2016). Why do satisfied customers defect? A closer look at the simultaneous
effects of switching barriers and inducements on customer loyalty. Journal of
Service Theory and Practice, 27(3), 616-641.
D’Alessandro, J., Johnson, L., Gray, D., & Carter, L. (2014). Consumer satisfaction
versus churn in the case of upgrades of 3G to 4G cell networks. Mark Lett, 489-
500.
Dominique-Ferreira, S., Vasconcelos, H., & F. Proença, J. (2014). Determinants of
customer price sensitivity: an empirical analysis. Journal of Services Marketing,
30(3), 327-340.
Frost & Sullivan. (2018). Digital Market Overview: Indonesia. London: Frost &
Sullivan.
Gee, R., Coates, G., & Durham. (2008). Understanding and profitably managing
customer loyalty. Marketing Intelligence & Planning, 359-374.
Indonesia Investments. (2018, April 9). Indonesia Investments. (Indonesia Investments)
Retrieved January 25, 2019, from
https://www.indonesia-investments.com/news/todays-headlines/over-100-
million-prepaid-sim-cards-blocked-by-indonesian-government/item8718?
J. Gerpott, T., Thomas, S., & Weichert, M. (2014). Usage of established and novel
mobile communication services: Substitutional, independent or complementary?
Information System Front, 491-507.
Khodabandehlou, S., & Rahman, M. Z. (2017). Comparison of supervised machine
learning techniques for customer churn prediction based on analysis of customer
behavior. Journal of Systems and Information Technology, 65-93.
Kim, M.-J., Kim, J., & Park, S.-Y. (2017). Understanding IPTV churning behaviors:
focus on users in South Korea. Asia Pacific Journal of Innovation, 11(2), 190-
213.
Kumar, D., & Garg, A. (2013). A Study of Data Mining Techniques for Churn
Prediction. International Journal of Science, Engineering, and Computer
Technology, III(1), 1-4.

52
Kumari, J. A., & Kumari, M. G. (2012). Analysis of churn behavior of consumers in
Indian telecom sector. Journal of Indian Business Research, 4(1), 24-35.
Lee, E.-B., Kim, J., & Lee, S.-G. (2017). Predicting customer churn in mobile industry
using data mining technology. Industrial Management & Data Systems, 117(1),
90-109.
Li, H., Wu, D., Li, G.-X., Ke, Y.-H., Li, W.-J., Zheng, Y.-H., & Lin, X.-L. (2015).
Enhancing Telco Service Quality with Big Data Enabled Churn Analysis:
Infrastructure, Model, and Deployment. JOURNAL OF COMPUTER SCIENCE
AND TECHNOLOGY, 30(6), 1201–1214.
Lin, W.-C., Tsai, C.-F., & Ke, S.-W. (2014). Dimensionality and data reduction in
telecom churn prediction. Kybernetes, 43(5), 737-749.
Mittal, S. (2018). Indonesia Industry Focus Telecom Sector. London: DBS Group
Research.
Neslin, S. A., Taylor, G. A., Grantham, K. D., & McNeil, K. R. (2013). Overcoming the
“recency trap” in customer relationship management. Academy of Marketing
Science, 320–337.
Peng, C.-Y. J., Lee, K. L., & Ingersoll, G. M. (2002). An Introduction to Logistic
Regression Analysis and Reporting. The Journal of Education Research, 9(1), 3-
14.
Pitta, D., Franzak, F., & Fowler, D. (2006). A strategic approach to building online
customer loyalty: integrating customer profitability tiers. Journal of Consumer
Marketing, 421-429.
Pratompong, S., Tsani, M. A., & Bohlin, E. (2011). An analysis of switching behavior
in the Thai cellular market. Emerald Group Publishing Limited, 13(4), 61-74.
Quach, T. N., Jebarajakirthy, C., & Thaichon, P. (2015). The effects of service quality
on internet service provider customers’ behaviour. Asia Pacific Journal of
Marketing and Logistics, 28(3), 435-463.
Ram, J., & Wu, M.-L. (2016). A fresh look at the role of switching cost in influencing
customer loyalty. Asia Pacific Journal of Marketing and Logistics, 28(4), 616-
633.
Ranaweera, C., & Prabhu, J. (2003). On the relative importance of customer satisfaction
and trust as determinant of customer retention and positive word of mouth.
Journal of Targeting, Measurement and Analysis for Marketing, 12(1), 82.
Ranaweera, C., & Prabhu, J. (2003). The Influence of Satisfaction, Trust and Switching
Barriers on Customer Retention in a Continuous Purchasing Setting.
International Journal of Service Industry Management, 14(3), 374-395.
Shafei, I., & Tabaa, H. (2016). Factors affecting customer loyalty for mobile
telecommunication industry. EuroMed Journal of Business, 11(3), 347-361.

53
Shen, S.-T. (2015). People and their smartphones – mapping mobile interaction in the
modern connected world. International Journal for Computer-Aided
Engineering and Software, 1642-1658.
Steiner, W. J., Siems, F. U., Webber, A., & Guhl, D. (2013). How customer satisfaction
with respect to price and quality affects customer retention: an integrated
approach considering non linear effects . Springer-Verlag Berlin Heidelberg, 84,
879-912.
Svendsen, G. B., & Prebensen, N. K. (2011). The effect of brand on churn in the
telecommunications sector. European Journal of Marketing, 47(8), 1177-1189.
Tahir, M., & Batool, S. (2018). The Effect of Customer Relationship Management
Program on Customer Retention Mediated by Firm Reputation in Telecom
Sector. City University Research Journal, 6(1), 90-102.
Uncles, M. D., Dowling, G. R., & Hammond, K. (2003). Customer Loyalty and Loyalty
Programs. The Journal of Consumer Marketing, 294-316.
Xiong, L., Ceridwyn, K., & Hu, C. (2013). Where is the love? Investigating multiple
membership and hotel customer loyalty. International Journal of Contemporary
Hospitality Management, 572-592.

54
LAMPIRAN
UJI REGRESI LOGISTIK

Uji Beda
Levene's Test for
t-test for Equality of Means
Equality of Variances
Sig. (2- Mean Std. Error 95% Confidence
F Sig. t df
tailed) Difference Difference Lower Upper
Equal variances assumed 12.24 0.000 -1.10 3095.00 0.272 -0.49 0.45 -1.37 0.39
age
Equal variances not assumed -1.12 2411.11 0.262 -0.49 0.44 -1.35 0.37
Equal variances assumed 161.79 0.000 -12.57 3095.00 0.000 -656.34 52.22 -758.73 -553.96
los
Equal variances not assumed -14.52 3083.92 0.000 -656.34 45.22 -745.00 -567.68
Equal variances assumed 128.98 0.000 -14.11 3095.00 0.000 -55.61 3.94 -63.33 -47.88
poin
Equal variances not assumed -18.15 2537.05 0.000 -55.61 3.06 -61.61 -49.60
Equal variances assumed 86.29 0.000 -12.51 3095.00 0.000 (143,585) 11474.33 -166083 -121087
all_rev
Equal variances not assumed -15.98 2615.41 0.000 (143,585) 8985.76 -161205 -125965
Equal variances assumed 85.21 0.000 -8.71 3095.00 0.000 -196.76 22.60 -241.07 -152.45
all_trx
Equal variances not assumed -11.70 2043.32 0.000 -196.76 16.81 -229.73 -163.78
Equal variances assumed 119.58 0.000 -11.99 3095.00 0.000 -91962.27 7672.66 -107006 -76918.26
rev_dominant
Equal variances not assumed -15.80 2268.61 0.000 -91962.27 5821.23 -103378 -80546.78
Equal variances assumed 0.15 0.699 -0.87 3095.00 0.383 -1.17 1.34 -3.80 1.46
all_rev_growth
Equal variances not assumed -0.93 2725.40 0.351 -1.17 1.25 -3.63 1.29
Equal variances assumed 10.87 0.001 -2.66 3095.00 0.008 -1.98 0.75 -3.44 -0.52
all_trx_growth
Equal variances not assumed -3.57 2039.59 0.000 -1.98 0.55 -3.07 -0.89
rev_dominant_gro Equal variances assumed 7.51 0.006 -4.66 3095.00 0.000 -0.95 0.20 -1.35 -0.55
wth Equal variances not assumed -5.20 2963.61 0.000 -0.95 0.18 -1.31 -0.59
Equal variances assumed 862.84 0.000 133.13 3095.00 0.000 36.72 0.28 36.18 37.26
recency
Equal variances not assumed 113.19 1451.57 0.000 36.72 0.32 36.08 37.36
Equal variances assumed 50.14 0.000 -2.93 3095.00 0.003 -0.09 0.03 -0.16 -0.03
avg_ces
Equal variances not assumed -2.97 1788.61 0.007 -0.09 0.03 -0.16 -0.03

market_status device_type segment_type reedemer_flag end_ces


Mann-Whitney U 1,062,744 1,069,299 550,873 601,787 1,047,638
Wilcoxon W 3,061,744 3,068,299 2,549,873 1,205,138 1,650,989
Z -1.644 -3.181 -25.203 -24.445 -3.608
Asymp. Sig. (2-tailed) 0.100 0.001 0.000 0.000 0.000

Uji Statistik Deskriptif


churn_status Mean Std. Deviation Std. Error Mean
Churn 35.24 11.305 0.341
age
No Churn 35.73 12.217 0.273
Churn 537.91 927.401 27.988
los
No Churn 1194.25 1587.841 35.514
Churn 20.03 36.610 1.105
poin
No Churn 75.64 127.721 2.857
Churn 36632.553 115168.0323 3475.6079
all_rev
No Churn 180217.157 370485.4277 8286.3779
Churn 40.82 59.142 1.785
all_trx
No Churn 237.58 747.470 16.718
Churn 17131.725 49456.5358 1492.5281
rev_dominant
No Churn 109093.997 251568.1596 5626.6419
Churn 291.3343% 3024.96248% 91.28908%
all_rev_growth
No Churn 408.3471% 3838.98528% 85.86379%
Churn -5.0738% 186.78006% 5.63676%
all_trx_growth
No Churn 192.9039% 2464.77797% 55.12789%
rev_dominant_gr Churn -17.2824% 408.97938% 12.34242%
owth No Churn 77.7708% 603.75084% 13.50366%
Churn 38.65 9.989 0.301
recency
No Churn 1.93 5.360 0.120
Churn 4.61 0.997 0.030
avg_ces
No Churn 4.70 0.749 0.017

55
churn_status Mean Rank Sum of Ranks
Churn 1580.61 1735509.00
market_status
No Churn 1531.64 3061744.00
Churn 1574.64 1728954.50
device_type
No Churn 1534.92 3068298.50
Churn 2046.79 2247380.00
segment_type
No Churn 1275.57 2549873.00
Churn 1097.58 1205138.00
reedemer_flag
No Churn 1796.96 3592115.00
Churn 1503.63 1650988.50
end_ces
No Churn 1573.92 3146264.50

Uji Multikoliniearitas
Unstandardized Standardized 95.0% Confidence
t Sig. Correlations Collinearity Statistics
Coefficients Coefficients Interval for B
Lower Upper
B Std. Error Beta Zero-order Partial Part Tolerance VIF
Bound Bound
(Constant) 0.976 0.022 44.935 0.000 0.934 1.019
age 0.000 0.000 -0.011 -1.629 0.103 -0.001 0.000 0.020 -0.029 -0.011 0.985 1.015
los 9.236E-06 0.000 0.028 3.872 0.000 0.000 0.000 0.220 0.070 0.027 0.945 1.059
poin -1.706E-05 0.000 -0.004 -0.457 0.647 0.000 0.000 0.246 -0.008 -0.003 0.670 1.493
all_rev 1.574E-08 0.000 0.010 0.684 0.494 0.000 0.000 0.219 0.012 0.005 0.210 4.762
all_trx 2.694E-06 0.000 0.003 0.481 0.631 0.000 0.000 0.155 0.009 0.003 0.938 1.066
rev_dominant 2.935E-08 0.000 0.013 0.860 0.390 0.000 0.000 0.211 0.015 0.006 0.215 4.658
all_rev_growth -6.265E-07 0.000 -0.005 -0.637 0.524 0.000 0.000 0.016 -0.011 -0.004 0.883 1.132
all_trx_growth 2.499E-06 0.000 0.010 1.491 0.136 0.000 0.000 0.048 0.027 0.010 0.985 1.015
rev_dominant_growth 1.003E-05 0.000 0.011 1.546 0.122 0.000 0.000 0.084 0.028 0.011 0.874 1.144
avg_ces 0.003 0.004 0.005 0.786 0.432 -0.005 0.011 0.052 0.014 0.005 0.993 1.007
recency -0.023 0.000 -0.911 -123.091 0.000 -0.023 -0.023 -0.923 -0.912 -0.850 0.870 1.150

Uji Regresi Logistik


95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
age 0.003 0.003 0.778 1 0.378 1.003 0.997 1.009
device_type(1) -0.607 0.197 9.466 1 0.002 0.545 0.370 0.802
Constant 1.080 0.229 22.142 1 0.000 2.944

95% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B)
Lower Upper
avg_ces 0.062 0.082 0.567 1 0.451 1.064 0.906 1.249
end_ces 0.066 0.072 0.837 1 0.360 1.068 0.928 1.230
Constant 0.005 0.204 0.001 1 0.981 1.005

95% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B)
Lower Upper
market_status -0.078 0.034 5.411 1 0.020 0.925 0.866 0.988
Constant 0.740 0.072 106.854 1 0.000 2.096

95% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B)
Lower Upper
los 0.000 0.000 72.647 1 0.000 1.000 1.000 1.001
segment_type -0.819 0.098 69.210 1 0.000 0.441 0.363 0.535
poin 0.013 0.002 67.225 1 0.000 1.013 1.010 1.016
reedemer_flag(1) 1.209 0.095 161.100 1 0.000 3.351 2.780 4.038
Constant 1.961 0.395 24.583 1 0.000 7.106

56
95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B)
Lower Upper
all_rev_growth 0.000 0.000 0.984 1 0.321 1.000 1.000 1.000
all_trx_growth 0.002 0.000 42.046 1 0.000 1.002 1.002 1.003
rev_dominant_growth 0.001 0.000 18.008 1 0.000 1.001 1.001 1.002
Constant 0.543 0.038 199.190 1 0.000 1.721

95% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B)
Lower Upper
all_rev 0.000 0.000 2.202 1 0.138 1.000 1.000 1.000
all_trx 0.000 0.000 0.096 1 0.757 1.000 0.999 1.001
rev_dominant 0.000 0.000 14.952 1 0.000 1.000 1.000 1.000
recency -0.346 0.024 202.649 1 0.000 0.707 0.674 0.742
Constant 7.402 0.682 117.622 1 0.000 1638.574

95% C.I.for EXP(B)


B S.E. Wald df Sig. Exp(B)
Lower Upper
age -0.004 0.015 0.064 1 0.801 0.996 0.968 1.025
los 0.000 0.000 0.008 1 0.927 1.000 1.000 1.000
market_status -0.162 0.155 1.089 1 0.297 0.851 0.628 1.152
device_type(1) -1.234 0.995 1.540 1 0.215 0.291 0.041 2.044
segment_type 0.059 0.318 0.034 1 0.854 1.060 0.568 1.979
poin 0.002 0.004 0.215 1 0.643 1.002 0.994 1.010
reedemer_flag(1) 0.935 0.375 6.225 1 0.013 2.547 1.222 5.309
all_rev 0.000 0.000 2.184 1 0.139 1.000 1.000 1.000
all_trx 0.000 0.000 0.495 1 0.482 1.000 0.999 1.000
rev_dominant 0.000 0.000 8.409 1 0.004 1.000 1.000 1.000
all_rev_growth 0.000 0.000 3.094 1 0.079 1.000 1.000 1.000
all_trx_growth 0.001 0.001 1.377 1 0.241 1.001 1.000 1.002
rev_dominant_growth 0.000 0.000 5.651 1 0.017 1.000 1.000 1.001
avg_ces 0.345 0.485 0.507 1 0.477 1.412 0.546 3.650
end_ces -0.158 0.450 0.123 1 0.726 0.854 0.354 2.063
recency -0.346 0.025 191.618 1 0.000 0.707 0.674 0.743
Constant 7.252 2.096 11.976 1 0.001 1410.574
Final Logit Function:
ܻ
‫݊ܮ‬ ൌ
͹Ǥʹ ͷʹ ൅ ͲǤͻ ͵ ͷܺௗ
௥௘ௗ௘௘௠ ௘௥ ୀଵ ൅ ͲǤ
ͲͲܺ௥௘௩̴ ௗ௧௢௠ ௜௡௔௡ ௧ ൅ ͲǤͲͲܺ௥௘௩̴ ௗ௧௢௠ ௜௡௔௡௧̴ ௚௥௢௪ ௧௛ െͲǤ͵ Ͷ͸ܺ௥௘௖௘௡௖௬
ͳെ ܻ

57

Anda mungkin juga menyukai