Maulidya.
Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam,Universitas Negeri Surabaya
dyamoly@yahoo.co.id
Abstrak
Berbelanja merupakan aktifitas sehari-hari yang dilakukan oleh masyarakat untuk memenuhi kebutuhan hidup.
Salah satu tempat berbelanja adalah pasar. Jenis pasar menurut transaksinya dibedakan menjadi dua yaitu pasar
modern dan pasar tradisional. Dengan semakin banyaknya tempat-tempat perbelanjaan, konsumen bisa menentukan
sendiri dimana tempat mereka berbelanja. Mereka dapat memilih di pasar modern atau di pasar tradisional, tergantung
pada kebutuhan dan daya beli. Beberapa tahun terakhir ini di Kabupaten Sidoarjo khususnya wilayah Taman, banyak
dibangun supermarket maupun minimarket baru yang dapat mengancam keberadaan pasar tradisional. Hal ini
mencerminkan adanya pergeseran perilaku konsumen yang dulunya hanya berbelanja di pasar tradisional, sekarang
mulai beralih berbelanja di pasar modern. Pengelompokkan konsumen menjadi penting untuk mengetahui komposisi
konsumen berdasarkan tempat kebiasaan mereka berbelanja kebutuhan sehari-hari. Tujuan klasifikasi adalah
mengelompokkan obyek penelitian berdasarkan serangkaian variabel-variabel yang disebut sebagai variabel bebas.
Dalam penelitian ini digunakan dua metode yaitu analisis diskriminan dan regresi logistik. Hasil penelitian ini
menunjukkan bahwa variabel yang secara signifikan mempengaruhi pengelompokan konsumen berdasarkan tempat
berbelanja dengan menggunakan metode analisis diskriminan adalah adalah variabel promosi. Sedangkan jika
menggunakan regresi logistik variabel bebas yang berpengaruh adalah variabel pendidikan dan variabel promosi.
Analisis diskriminan dan regresi logistik merupakan dua metode yang dapat digunakan sebagai metode
pengklasifikasian objek, sehingga kedua metode tersebut dapat dibandingkan berdasarkan ketepatan
pengelompokkanya. Hasil perbandingan kedua metode ini menunjukkan bahwa ketepatan klasifikasi pada analisis
regresi logistik lebih tinggi, yaitu 88,0 persen untuk data learning dan 80,0 persen untuk data testing jika dibandingkan
dengan analisis diskriminan yang hanya sebesar 86,7 persen untuk data learning dan 76,0 persen untuk data testing.
Kata Kunci: Pasar, Analisis Diskriminan, Regresi Logistik
Abstract
Shopping is an activity that done by the society to fulfill their necessary of life. Market is one of the shopping
place. Market divided in two kinds are: traditional and modern market. The consumers can determine their selves to
bought in many shopping places. They also choose modern market or traditional market , depending on the needs and
purchasing power . The last few years , especially region Taman in Sidoarjo area, many people built shopping center
and minimarkets that threaten the existence of the traditional market. Now, many people move modern market as
shoppinh place. Group of on consumers becames the important being to know the composition based on their habits in
daily shopping . The purpose of classification aggomerate the objects of research based on variables are referred to as
independent variables. The study used two methods discriminant analysis and logistic regressions. The result of study
showed that the variables that significanly affect the grouping consumers based on place where the shop using
discriminant analysis method is variable promotion. Mean while, if using logistic regression the impact for education
variable and promotion variable. discriminant analysis and logistic regression are two methods that using object of
classification method. The two methods can be comparing based on accuracy of agglomerate. The result of comparison
these methods shows that the classification accuracy of the logistic regression analysis was higher, 88.0 percent for
learning data, 80.0 percent for testing data, compared with discriminant analysis only amounted to 86.7 percent for the
learning data and 76 , 0 percent for testing data.
Keywords: Market, Discriminant analysis, Logistic regression
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)
mempunyai anggota 24.000 pasar, yang mencakup lim f ( x) 1 . Bentuk model regresi logistik adalah
x of
12,60 juta pedagang tersebar di 26 provinsi. Dapat
dibayangkan, jika separuh dari jumlah pedagang ini (Agresti,1990) :
exp( E 0 E1 x)
gulung tikar karena dagangannya selalu rugi dan tidak S ( x)
1 exp( E 0 E1 x)
dapat bertahan di tengah derasnya persaingan usaha
yang semakin ketat dengan pasar modern, hasilnya Model regresi logistik dengan k variabel bebas
adalah jumlah pengangguran Indonesia yang akan adalah:
meningkat. Berdasarkan uraian diatas maka penulis exp( E0 E1 x1 ... E k xk )
S ( x)
tertarik untuk mengetahui pola hubungan antara 1 exp( E0 E1 x1 ... E k xk )
pemilihan tempat belanja terhadap variabel-variabel Jika model ditransformasikan dengan
yang mempengaruhinya dan ketepatan klasifikasi antara transformasi logit, maka akan menghasilkan bentuk logit
metode regersi logistik dan analisis diskriminan. : g ( x) E0 E1x1 ... Ek xk
2 KAJIAN PUSTAKA 2.3 Pendugaan Parameter
Penaksiran parameter pada model regresi
2.1 Regresi logistik dapat menggunakan metode Maksimum
2
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)
Likelihood Estimator (MLE). Dengan menetapkan Untuk variabel bebas dikotomus, ada dua nilai S (x) dan
asumsi distribusi binomial dan setiap objek pengamatan § eE0 E1 · § 1 ·
¨ ¸ ¨ ¸
dua nilai 1- S
saling independen, fungsi likelihood metode MLE ©1 e
E0 E1
¹ ©1 eE0 E1
¹
\
merupakan fungsi linear maka untuk memperoleh § e E0 · § 1 ·
taksiran parameter dilakukan proses iterasi dengan ¨ E0 ¸ ¨ E ¸
©1 e ¹ ©1 e 0 ¹
metode Newton-Raphson, dengan menentukan nilai awal eE0 E1
dari E yaitu E .
0 eE0
e E0 E1 ) E0
2.3.1 Pengujian Parameter E1
Uji yang dapat digunakan untuk menguji e
signifikansi koefisien dari model dapat menggunakan Jika nilai % = 1, maka antara kedua variabel tidak
uji secara parsial maupun serentak terdapat hubungan. Jika nilai % < 1, maka antara kedua
1. Uji Parsial variabel terdapat hubungan negatif dan demikian
Statistik uji Wald digunakan untuk menguji sebaliknya bila % >1 maka kedua variabel terhadap
parameter secara parsial (Hosmer and Lemeshow, 2000). hubungan positif.
Rumus umum untuk uji-Wald 2.6 Analisis Multivariat
berdasarkan hipotesis : Data multivariat merupakan data hasil
H0 i = 0 pengukuran pada beberapa variabel yang secara umum
dinotasikan sebagai xij . Notasi tersebut menunjukan
H1 i •
Statistik Uji : Wald EÖi harga tertentu dari pengamatan ke ±i pada variabel ke ± j
( w)
SE ( EÖi ) dan jika terdapat p variabel dan ada sebanyak n
(2.13) pengamatan, yang dapat ditunjukkan dalam bentuk
daerah penolakan H0 adalah jika W ! F(2db,D ) atau p-value matriks seperti dibawah ini, dimana xnp merupakan
. objek pengamatan ke-n untuk variabel ke-p
2. Uji Serentak ª x11 x12 x1 p º
« »
Untuk mengetahui signifikansi model secara « x21 x22 x2 p »
X « »
keseluruhan.
« »
H0 1 2 i=0 «¬ xn1 xn 2 xnp »¼
H1 : paling sedikit ada satu i • (i = 1, 2, ...., k)
4. Matriks Varians dan Kovarians
Statistik Uji :
n1 n0 Untuk lebih memudahkan dalam menganalisis
§ n1 · § n0 · data, varians ± kovarians sampel dapat di susun dalam
¨ ¸ ¨ ¸
2 ln n© ¹ © ¹
n n
G (2.14)sebuah matriks dengan ukuran pxp.
– SÖi (1 SÖi )(1 yi )
i 1
yi
ª S11
«
S12 S1 p º
»
S « S21 S22 S2 p »
« »
H0 akan ditolak jika G > X Y .) atau p-value . , dengan « »
v = p-1 dimana p adalah banyaknya variabel bebas. ¬« S p1 S p2 S pp ¼»
2.4 Uji Kesesuaian Model Diagonal utama dari matriks menyatakan
Uji kesesuaian model digunakan untuk menilai varians, dan selain diagonal utama menyatakan
apakah model sesuai atau tidak. Hipotesis yang kovarians.
digunakan sebagai berikut. 2.8 Analisis Diskriminan
H0 : model sesuai Analisis diskriminan adalah teknik statistika
H1 : model tidak sesuai Statistik uji (Hosmer ± yang dipergunakan untuk mengklasifikasikan suatu
Lemeshow, 2000): individu atau observasi ke dalam suatu kelas atau
g
(o n 'k S k )2 kelompok berdasarkan sekumpulan variabel-variabel
CÖ ( Hosmer Lemeshow) ¦ k (2.15)
k 1 n 'k S k (1 S k )
(Johnson & Wichern 2007). Model umum analisis
diskriminan merupakan suatu kombinasi linear yang
bentuknya sebagai berikut:
Apabila CÖ X (2db,D ) maka gagal tolak H0.. Z jk a Wi X ik ... Wn X nk
2.5 Odds Rasio 2.9 Uji Asumsi Untuk Analisis Diskriminan
Odds ratio didefinisikan sebagai perbandingan Membentuk fungsi diskriminan yang optimal
dari nilai variabel sukses terhadap variabel bernilai gagal. diperlukan beberapa asumsi terhadap data yang
digunakan. Asumsi ini antara lain adalah data pada
variabel bebas seharusnya berdistribusi normal
multivariat dan adanya kesamaan matriks varians -
kovarians antar kelompok.
2.9.1 Pengujian Normal Multivariat
Menurut Johnson dan Wichern (2007), untuk
memeriksa data apakah merupakan normal
3
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)
g g
Sumber : Johnson and Wichern (2007)
M ¦ n ln | S | ¦ n ln | S
i i i |
i 1 i 1 n01 n10
§ · APER
2 p2 3 p 1 ¨ g 1 1 ¸
n0 n1
C 1
1 ¨¦ ¸
6( p 1)( g 1) ¨ i 1 ni g
¸ Sedangkan ketepatan prediksi pengelompokan secara
¨
©
¦
i 1
ni ¸
¹ tepat dapat menggunakan rumus Hit Ratio
dengan hipotesis sebagai berikut n00 n11
HitRatio u100%
H 0 : ¦1 ¦ 2 ... ¦ k ¦ n0 n1
H1 :min imal ada satu ¦i z ¦ 2.14 Pembagian Data Sampel
i 1, 2,..., k Salah satu cara untuk menghindari bias adalah
membagi sampel menjadi dua bagian yaitu data learning
Daerah penolakan untuk hipotesis nol dapat dihampiri
yang digunakan untuk membentuk aturan klasifikasi serta
dengan menggunakan sebaran chi-squere sebagai berikut:
pembentukan model baik model regresi logistik ataupun
MC 1 ! FD2 ,db model analisis diskriminan dan data testing yang
2.10 Metode Untuk Membentuk Fungsi Diskriminan digunakan untuk mengevaluasi fungsi klasifikasi,
Dalam penyusunan fungsi diskriminan ada dua menguji ketepatan, keakuratan, dan kehandalan dari
metode yang dapat digunakan, yaitu estimasi simultan fungsi yang telah dihasilkan.
dan estimasi stepwise. Cara mengetahui variabel bebas 2.15 Pasar
yang dapat mendiskriminasi suatu kelompok adalah Pasar adalah tempat fisik dimana para pembeli dan
menggunakan statistik uji Wilks Lamda, yaitu penjual berkumpul untuk membeli dan menjual barang.
k ni Jenis pasar menurut transaksinya dibedakan menjadi
¦¦ ( x
i 1 j 1
ij xi )( xij xi ) ' pasar modern dan pasar tradisional.
'* Pasar tradisional dikenal sebagai pasar yang
ni
k bangunannya relatif sederhana, dengan suasana yang
¦¦ ( x
i 1 j 1
ij x )( xij x)' relatif kurang menyenangkan (ruang tempat usaha
sempit, sarana parkir yang kurang memadai, kurang
4
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)
Pasar modern adalah pasar yang bersifat modern dimana n n 96, 04 | 100 . Jadi
(P )2 4(0,1) 2
barang-barang diperjual belikan dengan harga pas dan
layanan tersendiri. besarnya sampel yang digunakan dalam penelitian
ini adalah 100 responden.
2.16 Perilaku Konsumen
Menurut Kotler dan Keller (2009 : 166) perilaku 3.3 Jenis dan Sumber Data
konsumen adalah studi tentang bagaimana individu, Data yang digunakan dalam penelitian ini adalah
kelompok, dan organisasi memilih, membeli, data primer dan data sekunder.
menggunakan dan bagaimana barang, jasa, ide, atau 3.4 Instrumen Pengumpul Data
pengalaman untuk memuaskan kebutuhan dan keinginan Instrumen untuk mengumpulkan data penelitian
mereka. ini adalah kuesioner. Sebelum digunakan untuk
Menurut Kotler dan Keller (2009 : 214) terdapat mendapatkan data, maka terlebih dahulu dilakukan
beberapa faktor yang mempengaruhi perilaku konsumen, berbagai uji untuk mengetahui apakah kuesioner itu
diantaranya adalah : cukup layak untuk mengambil data variabel yang diteliti,
1. Faktor Budaya dalam hal ini menggunakan uji validitas dan uji
2. Faktor Sosial reliabilitas untuk pengujian instrumen. Kuesioner
3. Faktor Pribadi dibagikan kepada 30 responden terlebih dahulu.
3.4.1 Uji Validitas dan Reliabilitas
2.17 Bauran Pemasaran Eceran (Retail Marketing Statistik uji
Mix) § n · § n ·§ n ·
n ¨ ¦ X iYi ¸ ¨ ¦ X i ¸¨ ¦ Yi ¸
Adapun pengertian dari Bauran Pemasaran rxy ©i1 ¹ © i 1 ¹© i 1 ¹
(Marketing Mix) menurut Kotler dan Keller (2009 : 19) ª n · º ªª n § n · ºº
2 2
§ n
« n¦ X i ¨ ¦ X i ¸ » « « n¦ Yi 2 ¨ ¦ Yi ¸ » »
2
5
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)
6
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)
mana yang berpengaruh secara individu terhadap variabel Daerah penolakan H0: CÖ !$2(0,05;6) = 12,5916
respon, sebelum dilakukan pemodelan antara variabel DWDX QLODL SBYDOXH ! .. Dengan demikian H0 diterima.
respon dengan variabel-variabel bebas secara bersama- Kesimpulannya bahwa model sesuai atau tidak terdapat
sama. Untuk itu, perlu dilakukan pengujian signifikansi perbedaan yang nyata antara observasi dengan prediksi
parameter sebagai koefisien dari variabel bebas pada model.
masing-masing model individu. 4.9 Perbandingan Hasil kalsifikasi Analisis
Kesimpulan: Faktor-faktor yang berpengaruh Diskriminan dan Regresi Logistik
secara individu terhadap pemilihan tempat berbelanja Hasil ketepatan klasifikasi data learning untuk
konsumen adalah produk (X6), harga (X7), dan promosi analisis diskriminan adalah 86,7%. Sedangkan untuk
(X9). Hal ini terlihat dari nilai W pada masing-masing peluang kesalahan klasifikasi digunakan ukuran Apparent
variabel tersebut lebih besar dari nilai F(2df ,D ) 3,841. Error Rates (APER).
Sehingga keputusannya tolak H0. Langkah selanjutnya n01 n10 5 5
APER 0,13
adalah menginterpretasikan model tersebut. n0 n1 38 37
4.5.2 Model Regresi Logistik Berganda Presentase kebenaran keseluruhan yang
Meskipun dari pemodelan regresi logistik dihasilkan pada data testing sebesar 76,0%, sedangkan
individu telah diketahui bahwa variabel produk, harga, data learning sebesar 86,7%. Oleh karena itu model dapat
dan, promosi berpengaruh secara signifikan terhadap dikatakan sudah valid. Nilai APER pada data testing
variabel respon, namun belum diketahui bagaimana adalah sebesar
hubungan antara variabel lain. Karena jika ternyata n01 n10 2 4
hubungannya sangat erat, maka dimungkinkan salah satu APER 0, 24
n0 n1 9 16
variabel akan menjadi tidak signifikan lagi pengaruhnya
terhadap variabel respon. Oleh karena itu, perlu 2. Hasil Klasifikasi Pada Regresi Logistik
dilakukan pemodelan regresi logistik dengan Hasil ketepatan klasifiaksi data learning pada
memasukkan semua variabel secara bersama-sama untuk regresi logistik adalah 88%, sehingga
memeriksa ada atau tidaknya hubungan antara variabel n01 n10 4 5
APER 0,12
tersebut. Untuk mengetahui apakah parameter-parameter n0 n1 38 37
model telah signifikan atau tidak maka dilakukan Presentase ketepatan klasifikasi secara
langkah-langkah pengujian hipotesis sebagai berikut keseluruhan pada data testing juga cukup besar yaitu
1.Uji Serentak 80%. Nilai APER pada data testing adalah sebesar
Dari hasil analisis diperoleh nilai )DEPQJC adalah n01 n10 3 2
APER 0, 20
VHGDQJNDQ $2(14;0,05) = 23,6848. Karena nilai n0 n1 9 16
2
)DEPQJC > ï14;0,05 maka tolak *0 , yang berarti paling tidak Hasil perbandingan presentase ketepatan klasifikasi
ada satu variabel yang berpengaruh atau mempunyai antara analisis regresi logistik dan analisis diskriminan
kontribusi terhadap model. menunjukkan bahwa analisis regresi logistik lebih baik
2.Uji parsial untuk digunakan. Hal ini dikarenakan ketepatan
Untuk mengetahui pengaruh yang diberikan klasifikasi regresi logistik sebesar 80,0 persen dan
setiap variabel bebas, perlu dilakukan pengujian analisis diskriminan sebesar 76,0 persen. Regresi logistik
parameter secara parsial menggunakan uji Wald. Hasil uji juga memberikan selisih yang paling minimum antara
signifikansi parameter regresi logistik secara parsial data learning dan data testing. Jadi, metode analisis
dengan sembilan variabel bebas yang dapat diketahui regresi logistik dapat memberikan hasil klasifikasi yang
bahwa secara individu variabel yang signifikan lebih baik daripada analisis diskriminan.
berpengaruh terhadap pemilihan tempat berbelanja
konsumen adalah variabel pendidikan(X3)(2) dan variabel 5. KESIMPULAN DAN SARAN
promosi(X9), hal ini terlihat dari nilai W pada masing ± 1. Hasil analisis regresi logistik menunjukkan bahwa
masing variabel bebas X3 dan X9 lebih besar dari nilai variabel bebas yang secara signifikan berpengaruh
F(2df ,D ) =3,841 atau QLODL GDUL SBYDOXH . terhadap pemilihan tempat berbelanja adalah
pendidikan (X3) dan promosi (X9). Model yang
didapatkan untuk menggambarkan pola hubungan
antara variabel respon dan bebas adalah sebagai
berikut:
7
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)