Anda di halaman 1dari 8

PERBANDINGAN ANALISIS DISKRIMINAN DAN REGRESI LOGISTIK

(Studi Kasus Klasifikasi Konsumen Berdasarkan Tempat Berbelanja di Wilayah Taman-Sidoarjo)

Maulidya.
Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam,Universitas Negeri Surabaya
dyamoly@yahoo.co.id

Drs. Hery Tri Sutanto, M.Si


Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Surabaya
herytrisutanto@gmail.co.id

Affiati Oktaviarina, M.Sc


Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Surabaya
affiatioktaviarina@yahoo.co.id

Abstrak
Berbelanja merupakan aktifitas sehari-hari yang dilakukan oleh masyarakat untuk memenuhi kebutuhan hidup.
Salah satu tempat berbelanja adalah pasar. Jenis pasar menurut transaksinya dibedakan menjadi dua yaitu pasar
modern dan pasar tradisional. Dengan semakin banyaknya tempat-tempat perbelanjaan, konsumen bisa menentukan
sendiri dimana tempat mereka berbelanja. Mereka dapat memilih di pasar modern atau di pasar tradisional, tergantung
pada kebutuhan dan daya beli. Beberapa tahun terakhir ini di Kabupaten Sidoarjo khususnya wilayah Taman, banyak
dibangun supermarket maupun minimarket baru yang dapat mengancam keberadaan pasar tradisional. Hal ini
mencerminkan adanya pergeseran perilaku konsumen yang dulunya hanya berbelanja di pasar tradisional, sekarang
mulai beralih berbelanja di pasar modern. Pengelompokkan konsumen menjadi penting untuk mengetahui komposisi
konsumen berdasarkan tempat kebiasaan mereka berbelanja kebutuhan sehari-hari. Tujuan klasifikasi adalah
mengelompokkan obyek penelitian berdasarkan serangkaian variabel-variabel yang disebut sebagai variabel bebas.
Dalam penelitian ini digunakan dua metode yaitu analisis diskriminan dan regresi logistik. Hasil penelitian ini
menunjukkan bahwa variabel yang secara signifikan mempengaruhi pengelompokan konsumen berdasarkan tempat
berbelanja dengan menggunakan metode analisis diskriminan adalah adalah variabel promosi. Sedangkan jika
menggunakan regresi logistik variabel bebas yang berpengaruh adalah variabel pendidikan dan variabel promosi.
Analisis diskriminan dan regresi logistik merupakan dua metode yang dapat digunakan sebagai metode
pengklasifikasian objek, sehingga kedua metode tersebut dapat dibandingkan berdasarkan ketepatan
pengelompokkanya. Hasil perbandingan kedua metode ini menunjukkan bahwa ketepatan klasifikasi pada analisis
regresi logistik lebih tinggi, yaitu 88,0 persen untuk data learning dan 80,0 persen untuk data testing jika dibandingkan
dengan analisis diskriminan yang hanya sebesar 86,7 persen untuk data learning dan 76,0 persen untuk data testing.
Kata Kunci: Pasar, Analisis Diskriminan, Regresi Logistik

Abstract
Shopping is an activity that done by the society to fulfill their necessary of life. Market is one of the shopping
place. Market divided in two kinds are: traditional and modern market. The consumers can determine their selves to
bought in many shopping places. They also choose modern market or traditional market , depending on the needs and
purchasing power . The last few years , especially region Taman in Sidoarjo area, many people built shopping center
and minimarkets that threaten the existence of the traditional market. Now, many people move modern market as
shoppinh place. Group of on consumers becames the important being to know the composition based on their habits in
daily shopping . The purpose of classification aggomerate the objects of research based on variables are referred to as
independent variables. The study used two methods discriminant analysis and logistic regressions. The result of study
showed that the variables that significanly affect the grouping consumers based on place where the shop using
discriminant analysis method is variable promotion. Mean while, if using logistic regression the impact for education
variable and promotion variable. discriminant analysis and logistic regression are two methods that using object of
classification method. The two methods can be comparing based on accuracy of agglomerate. The result of comparison
these methods shows that the classification accuracy of the logistic regression analysis was higher, 88.0 percent for
learning data, 80.0 percent for testing data, compared with discriminant analysis only amounted to 86.7 percent for the
learning data and 76 , 0 percent for testing data.
Keywords: Market, Discriminant analysis, Logistic regression
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

1 PENDAHULUAN Regresi yang berarti peramalan, penaksiran, atau


pendugaan pertama kali diperkenalkan oleh Sir Francis
Analisis multivariat merupakan metode statistik
Galton pada tahun 1877 sehubungan dengan
yang mempelajari pengolahan data dengan banyak
penelitiannya terhadap tinggi manusia. Persamaan regresi
variabel yang saling berkorelasi. Analisis multivariat
adalah persamaan matematik yang memungkinkan untuk
dapat dibedakan menjadi dua bagian besar, yaitu
meramalkan nilai-nilai suatu variabel tak bebas dari nilai-
analisis multivariat dependensi dan analisis
nilai satu atau lebih variabel bebas.
interdependensi. Jika kita menghadapi analisis yang
2.1.1 Regresi Linier Dan Regresi NonLinier
memuat satu variabel tak bebas, salah satu metode yang
Regresi dikatakan linier apabila hubungan antara
dapat digunakan pada analisis multivariat dependensi
variabel independen dan variabel dependennya adalah
yaitu metode analisis diskriminan. Analisis diskriminan
linier. Regresi linier dibagi menjadi dua yaitu regresi
adalah analisis multivariat yang diterapkan untuk
linier sederhana dan regresi linier berganda.
memodelkan hubungan antara satu variabel respon
Regresi linier berganda adalah regresi linier
yang bersifat dikotomus atau multikotomus maupun
yang mempunyai variabel bebas (x) lebih dari satu. Jika
kualitatif dengan variabel penjelas yang bersifat
pada regresi linier sederhana hanya terdapat satu variabel
kuantitatif. Dalam penerapannya, fungsi diskriminan ini
bebas, pada regresi linier berganda terdapat dua variabel
mengasumsikan data variabel bebas pada masing-
bebas atau lebih. Model regresi linier berganda adalah
masing kelompok berdistribusi normal multivariat dan
mempunyai struktur matriks varian kovarian yang sama Y E0 E1 x1 E2 x2 ... Ek xk H
untuk setiap populasi dalam variabel respon. Selain Nonlinier yang dimaksud pada regresi non linier
analisis diskriminan ada juga metode regresi yang bisa berarti nonlinier dalam variabel ataupun nonlinier
variabel responnya adalah data biner, dinamakan dalam parameter. Bentuk dari hubunganregresi nonlinier
regresi logistik. Menurut (Agresti,1990) regresi logistik adalah
adalah suatu analisis regresi yang digunakan untuk Yi f ( X i , J ) H
menggambarkan hubungan antara variabel respon
dengan sekumpulan variabel bebas, dimana variabel 2.2 Regresi Logistik
dependennya biner. Model regresi logistik biner merupakan model
Berbelanja merupakan suatu aktivitas yang matematika yang dapat digunakan untuk memodelkan
biasa dilakukan setiap orang, salah satu tempat hubungan antara variabel bebas X dengan variabel respon
berbelanja adalah pasar. Salah satu penerapan kedua Y yang bersifat biner. Variabel respon (y) mengikuti
metode tersebut untuk mengetahui faktor±faktor yang distribusi Bernoulli dengan fungsi probabilitas :
dipertimbangkan konsumen dalam memilih tempat f ( yi ) p yi (1 p)1 yi
, yi=0,1. Distribusi dari
untuk berbelanja barang yang dibutuhkan. Secara
nasional perkembangan pasar tradisional memang telah variabel respon ini merupakan pembeda antara regresi
mengalami penurunan bila dibanding dengan logistik dengan regresi linear. Adapun fungsi logistik
perkembangan pasar modern, sebagaimana hasil adalah sebagai berikut :
penelitian Ac Nielson (2005) terhadap perkembangan 1
f ( x) , f x f
pasar modern dan tradisional di Indonesia, pada trend 1 ex
pertumbuhannya pasar modern tumbuh pesat yaitu 34
% dan pasar tradisional mengalami penurunan 1 1 1 1 1 1
lim f
1 dan lim f)
0
pertumbuhan ± 8,5 5%. Pasar tradisional merupakan x of 1 e 1 0 xo f 1 e( 1 ef 1 f f
tulang punggung perekonomian yang tak bisa dibiarkan
tergerus oleh pasar modern yang semakin menjamur, Sehingga untuk x mendekati -’ PDND
karena pasar ini melibatkan jutaan pedagang yang
lim f ( x) 0 , sedangkan untuk x mendekati ’ PDND
relatif berskala kecil. Pedagang Pasar Seluruh Indonesia xo f

mempunyai anggota 24.000 pasar, yang mencakup lim f ( x) 1 . Bentuk model regresi logistik adalah
x of
12,60 juta pedagang tersebar di 26 provinsi. Dapat
dibayangkan, jika separuh dari jumlah pedagang ini (Agresti,1990) :
exp( E 0 E1 x)
gulung tikar karena dagangannya selalu rugi dan tidak S ( x)
1 exp( E 0 E1 x)
dapat bertahan di tengah derasnya persaingan usaha
yang semakin ketat dengan pasar modern, hasilnya Model regresi logistik dengan k variabel bebas
adalah jumlah pengangguran Indonesia yang akan adalah:
meningkat. Berdasarkan uraian diatas maka penulis exp( E0 E1 x1 ... E k xk )
S ( x)
tertarik untuk mengetahui pola hubungan antara 1 exp( E0 E1 x1 ... E k xk )
pemilihan tempat belanja terhadap variabel-variabel Jika model ditransformasikan dengan
yang mempengaruhinya dan ketepatan klasifikasi antara transformasi logit, maka akan menghasilkan bentuk logit
metode regersi logistik dan analisis diskriminan. : g ( x) E0 E1x1 ... Ek xk
2 KAJIAN PUSTAKA 2.3 Pendugaan Parameter
Penaksiran parameter pada model regresi
2.1 Regresi logistik dapat menggunakan metode Maksimum

2
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

Likelihood Estimator (MLE). Dengan menetapkan Untuk variabel bebas dikotomus, ada dua nilai S (x) dan
asumsi distribusi binomial dan setiap objek pengamatan § eE0 E1 · § 1 ·
¨ ¸ ¨ ¸
dua nilai 1- S
saling independen, fungsi likelihood metode MLE ©1 e
E0 E1
¹ ©1 eE0 E1
¹
\
merupakan fungsi linear maka untuk memperoleh § e E0 · § 1 ·
taksiran parameter dilakukan proses iterasi dengan ¨ E0 ¸ ¨ E ¸
©1 e ¹ ©1 e 0 ¹
metode Newton-Raphson, dengan menentukan nilai awal eE0 E1
dari E yaitu E .
0 eE0
e E0 E1 ) E0
2.3.1 Pengujian Parameter E1
Uji yang dapat digunakan untuk menguji e
signifikansi koefisien dari model dapat menggunakan Jika nilai % = 1, maka antara kedua variabel tidak
uji secara parsial maupun serentak terdapat hubungan. Jika nilai % < 1, maka antara kedua
1. Uji Parsial variabel terdapat hubungan negatif dan demikian
Statistik uji Wald digunakan untuk menguji sebaliknya bila % >1 maka kedua variabel terhadap
parameter secara parsial (Hosmer and Lemeshow, 2000). hubungan positif.
Rumus umum untuk uji-Wald 2.6 Analisis Multivariat
berdasarkan hipotesis : Data multivariat merupakan data hasil
H0 i = 0 pengukuran pada beberapa variabel yang secara umum
dinotasikan sebagai xij . Notasi tersebut menunjukan
H1 i •
Statistik Uji : Wald EÖi harga tertentu dari pengamatan ke ±i pada variabel ke ± j
( w)
SE ( EÖi ) dan jika terdapat p variabel dan ada sebanyak n
(2.13) pengamatan, yang dapat ditunjukkan dalam bentuk
daerah penolakan H0 adalah jika W ! F(2db,D ) atau p-value matriks seperti dibawah ini, dimana xnp merupakan
. objek pengamatan ke-n untuk variabel ke-p
2. Uji Serentak ª x11 x12 x1 p º
« »
Untuk mengetahui signifikansi model secara « x21 x22 x2 p »
X « »
keseluruhan.
« »
H0 1 2 i=0 «¬ xn1 xn 2 xnp »¼
H1 : paling sedikit ada satu i • (i = 1, 2, ...., k)
4. Matriks Varians dan Kovarians
Statistik Uji :
n1 n0 Untuk lebih memudahkan dalam menganalisis
§ n1 · § n0 · data, varians ± kovarians sampel dapat di susun dalam
¨ ¸ ¨ ¸
2 ln n© ¹ © ¹
n n
G (2.14)sebuah matriks dengan ukuran pxp.
– SÖi (1 SÖi )(1 yi )
i 1
yi
ª S11
«
S12 S1 p º
»
S « S21 S22 S2 p »
« »
H0 akan ditolak jika G > X Y .) atau p-value . , dengan « »
v = p-1 dimana p adalah banyaknya variabel bebas. ¬« S p1 S p2 S pp ¼»
2.4 Uji Kesesuaian Model Diagonal utama dari matriks menyatakan
Uji kesesuaian model digunakan untuk menilai varians, dan selain diagonal utama menyatakan
apakah model sesuai atau tidak. Hipotesis yang kovarians.
digunakan sebagai berikut. 2.8 Analisis Diskriminan
H0 : model sesuai Analisis diskriminan adalah teknik statistika
H1 : model tidak sesuai Statistik uji (Hosmer ± yang dipergunakan untuk mengklasifikasikan suatu
Lemeshow, 2000): individu atau observasi ke dalam suatu kelas atau
g
(o n 'k S k )2 kelompok berdasarkan sekumpulan variabel-variabel
CÖ ( Hosmer Lemeshow) ¦ k (2.15)
k 1 n 'k S k (1 S k )
(Johnson & Wichern 2007). Model umum analisis
diskriminan merupakan suatu kombinasi linear yang
bentuknya sebagai berikut:
Apabila CÖ X (2db,D ) maka gagal tolak H0.. Z jk a Wi X ik ... Wn X nk
2.5 Odds Rasio 2.9 Uji Asumsi Untuk Analisis Diskriminan
Odds ratio didefinisikan sebagai perbandingan Membentuk fungsi diskriminan yang optimal
dari nilai variabel sukses terhadap variabel bernilai gagal. diperlukan beberapa asumsi terhadap data yang
digunakan. Asumsi ini antara lain adalah data pada
variabel bebas seharusnya berdistribusi normal
multivariat dan adanya kesamaan matriks varians -
kovarians antar kelompok.
2.9.1 Pengujian Normal Multivariat
Menurut Johnson dan Wichern (2007), untuk
memeriksa data apakah merupakan normal

3
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

multivariat, dapat dilihat dari plot antara d j dengan


2 2.11 Fungsi Diskriminan
Fungsi diskriminan adalah kombinasi linear dari
chi-square § j 0,5 · apakah hasil plot variabel-variabel yang dimiliki oleh kelompok -
¨ ¸
© n ¹ kelompok yang akan diklasifikasikan. Untuk dua grup
menggambarkan garis lurus maka data tersebut dapat dapat dilakukan menggunakan fungsi diskriminan linier
dinyatakan sebagai normal multivariat. Statistik uji Fisher, yaitu
yang digunakan : Y ( x1 x2 ) ' S gab 1 x
d j [ X j X ]' S 1[ X j X ] , j 1, 2,..., n
2
Nilai fungsi diskriminan Z merupakan dasar
untuk menentukan suatu objek masuk kelompok yang
Hipotesis yang digunakan adalah mana dengan membandingkannya dengan rata-rata
H 0 : data berdistribusi multivariat normal. (centroid) dari nilai Z masing-masing kelompok. Jika ada
H1 : data tidak berdistribusi multivariat normal. dua kelompok masing-masing A dan B, maka
Pemeriksaan normal multivariat dilakukan dengan N AZB NBZ A
Z cu
algoritma sebagai berikut : NA NB
1. Menghitung d 2j 2.13 Kriteria Perbandingan
. Kriteria perbandingan teknik klasifikasi
2. Mendaftar d 2j sedemikian hingga didasarkan pada kesalahan klasifikasinya yang dikenal
dengan Apparent Error Rate (APER) merupakan nilai
d d d d ... d d
1
2 2
2
2
n
dari besar kecilnya jumlah observasi yang salah dalam
3. Membuat plot (d 2j , F 2 j 0,5 ) pengklasifikasian berdasarkan suatu fungsi klasifikasi
p;
n (Johnson & Wichern 2007). Adapun APER dihitung
Kriteria gagal tolak H 0 berarti data berdistribusi dengan terlebih dahulu membuat tabel klasifikasi sebagai
berikut:
multivariat normal, kriteria pemenuhan asumsi dilakukan
secara visual yaitu jika plot membentuk garis lurus
Tabel 2.2 Klasifikasi actual dan predicted group
berarti data dapat didekati sebaran normal (Johnson & Actual Predicted Group
Wichern 2007).
2.9.2 Pengujian Kesamaan Matrik Kovarian group
Menurut Morisson (1967) untuk pengujian
kehomogenan matriks kovarian dapat dilakukan dengan
S0 S1
XML %R[¶V 0 8ML %R[¶V 0 GDSDW GLUXPXVNDQ VHEDJDL
berikut S0 n00 n01 n0 n00
g
1
S g ¦n S i i
S1 n10 n1 n11 n11
¦n
i 1
i
i 1

g g
Sumber : Johnson and Wichern (2007)
M ¦ n ln | S | ¦ n ln | S
i i i |
i 1 i 1 n01 n10
§ · APER
2 p2 3 p 1 ¨ g 1 1 ¸
n0 n1
C 1
1 ¨¦ ¸
6( p 1)( g 1) ¨ i 1 ni g
¸ Sedangkan ketepatan prediksi pengelompokan secara
¨
©
¦
i 1
ni ¸
¹ tepat dapat menggunakan rumus Hit Ratio
dengan hipotesis sebagai berikut n00 n11
HitRatio u100%
H 0 : ¦1 ¦ 2 ... ¦ k ¦ n0 n1
H1 :min imal ada satu ¦i z ¦ 2.14 Pembagian Data Sampel
i 1, 2,..., k Salah satu cara untuk menghindari bias adalah
membagi sampel menjadi dua bagian yaitu data learning
Daerah penolakan untuk hipotesis nol dapat dihampiri
yang digunakan untuk membentuk aturan klasifikasi serta
dengan menggunakan sebaran chi-squere sebagai berikut:
pembentukan model baik model regresi logistik ataupun
MC 1 ! FD2 ,db model analisis diskriminan dan data testing yang
2.10 Metode Untuk Membentuk Fungsi Diskriminan digunakan untuk mengevaluasi fungsi klasifikasi,
Dalam penyusunan fungsi diskriminan ada dua menguji ketepatan, keakuratan, dan kehandalan dari
metode yang dapat digunakan, yaitu estimasi simultan fungsi yang telah dihasilkan.
dan estimasi stepwise. Cara mengetahui variabel bebas 2.15 Pasar
yang dapat mendiskriminasi suatu kelompok adalah Pasar adalah tempat fisik dimana para pembeli dan
menggunakan statistik uji Wilks Lamda, yaitu penjual berkumpul untuk membeli dan menjual barang.
k ni Jenis pasar menurut transaksinya dibedakan menjadi
¦¦ ( x
i 1 j 1
ij xi )( xij xi ) ' pasar modern dan pasar tradisional.
'* Pasar tradisional dikenal sebagai pasar yang
ni
k bangunannya relatif sederhana, dengan suasana yang
¦¦ ( x
i 1 j 1
ij x )( xij x)' relatif kurang menyenangkan (ruang tempat usaha
sempit, sarana parkir yang kurang memadai, kurang

4
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

menjaga kebersihan pasar, dan penerangan kurang baik). Z 2 p(1 p) (1,96) 2

Pasar modern adalah pasar yang bersifat modern dimana n n 96, 04 | 100 . Jadi
(P )2 4(0,1) 2
barang-barang diperjual belikan dengan harga pas dan
layanan tersendiri. besarnya sampel yang digunakan dalam penelitian
ini adalah 100 responden.
2.16 Perilaku Konsumen
Menurut Kotler dan Keller (2009 : 166) perilaku 3.3 Jenis dan Sumber Data
konsumen adalah studi tentang bagaimana individu, Data yang digunakan dalam penelitian ini adalah
kelompok, dan organisasi memilih, membeli, data primer dan data sekunder.
menggunakan dan bagaimana barang, jasa, ide, atau 3.4 Instrumen Pengumpul Data
pengalaman untuk memuaskan kebutuhan dan keinginan Instrumen untuk mengumpulkan data penelitian
mereka. ini adalah kuesioner. Sebelum digunakan untuk
Menurut Kotler dan Keller (2009 : 214) terdapat mendapatkan data, maka terlebih dahulu dilakukan
beberapa faktor yang mempengaruhi perilaku konsumen, berbagai uji untuk mengetahui apakah kuesioner itu
diantaranya adalah : cukup layak untuk mengambil data variabel yang diteliti,
1. Faktor Budaya dalam hal ini menggunakan uji validitas dan uji
2. Faktor Sosial reliabilitas untuk pengujian instrumen. Kuesioner
3. Faktor Pribadi dibagikan kepada 30 responden terlebih dahulu.
3.4.1 Uji Validitas dan Reliabilitas
2.17 Bauran Pemasaran Eceran (Retail Marketing Statistik uji
Mix) § n · § n ·§ n ·
n ¨ ¦ X iYi ¸ ¨ ¦ X i ¸¨ ¦ Yi ¸
Adapun pengertian dari Bauran Pemasaran rxy ©i1 ¹ © i 1 ¹© i 1 ¹
(Marketing Mix) menurut Kotler dan Keller (2009 : 19) ª n · º ªª n § n · ºº
2 2
§ n
« n¦ X i ¨ ¦ X i ¸ » « « n¦ Yi 2 ¨ ¦ Yi ¸ » »
2

adalah seperangkat alat yang digunakan oleh perusahaan ¬« i 1 © i 1 ¹ ¼» «¬ ¬« i 1 © i 1 ¹ ¼» »¼


untuk mencapai tujuan perusahaan di pasar sasarannya. Kriteria dalam menentukan validitas suatu kuesioner
Seperangkat alat seperti yang telah disebutkan diatas adalah suatu model (butir pertanyaan) dikatakan valid
terdiri dari 4 atau yang lebih dikenal dengan istilah 4 P jika tingkat signifikansinya di bawah 0,05 atau
(empat P). Keempat P tersebut menurut Mc Carthy a). Jika rhitung > rtabel maka pertanyaan dinyatakan valid.
dalam Kotler dan Keller (2009 ; 23) diantaranya adalah : b). Jika rhitung < rtabel maka pertanyaan dinyatakan tidak
valid.
1. Produk Uji reliabilitas dalam penelitian ini
2. Harga menggunakan metode Alfa Cronbach.
3. Lokasi Hipotesis:
4. Promosi H0 : Pertanyaan menghasilkan data yang tidak
reliabel.
3. METODE PENELITIAN H1 : Pertanyaan menghasilkan data yang reliabel.
3.1 Lokasi dan Objek Penelitian Tolak H0 atau hasil pengukuran reliabel jika nilai
Penelitian berlokasi di Kecamatan Taman- FURQEDFK¶V DOSKD lebih besar dari 0,60. Rumus ini ditulis
Sidoarjo, yaitu untuk pasar modern di gerai sebagai berikut
supermarket Alfa Midi dan Master sedangkan untuk ª k
º
Pasar Tradisional di Kecamatan Taman dan Pasar § k ·«
¦V 2
b »
¸ «1 »
b 1
r11 ¨
Puspa Agro. © k 1¹ « V t2 »
3.2 Populasi dan Sampel Penelitian «¬ »¼
Populasi dalam penelitian ini adalah pengunjung 3.5 Variabel Penelitian
pasar sehingga jumlahnya tidak diketahui dengan Variabel Respon (Y) = tempat belanja
pasti, sehingga jenis sampling yang dipilih yaitu Penelitian ini menggunakan satu variabel respon sebagai
purposive sampling. Teknik pengambilan sampel berikut :
menggunakan Purposive Sampling, yaitu teknik 0 = Pasar Tradisional (Pasar Taman, Puspa Agro)
penentuan sampel dengan mempertimbangkan 1 =Pasar Modern, yaitu terdiri dari supermarket( Alfa
karakter dan ciri ± ciri yang telah ditentukan terlebih Midi, Master).
dahulu untuk membatasi sampel. Populasi dalam Variabel Bebas (X) : Usia ( X1), Jenis kelamin (X2)
penelitian ini adalah pengunjung pasar sehingga Pendidikan (X3 )Pekerjaan ( X4 )Pendapatan ( X5) Produk
jumlahnya tidak diketahui dengan pasti, maka ( X6 )Harga ( X7) Promosi ( X8) Lokasi ( X9)
besarnya sampel yang diperlukan sangat 3.6 Prosedur Penelitian
dipengaruhi oleh maksimum error dan derajat Pemisahan penelitian menjadi dua bagian, yaitu
kepercayaan dalam populasi tersebut. Sehingga data learning dan data testing . Komposisi pembagian
besarnya sampel dapat diketahui dengan rumus data learning dan data testing pada penelitian ini adalah
binomunal proportions sebagai berikut 75% dan 25%
3.6.1 Langkah - Langkah Untuk Mencapai Tujuan
Pertama Yaitu :
1. Mendeskripsikan karakteristik konsumen.

5
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

2. Menguji Asumsi, 4 X7_1 0,772 Reliabel


3. Membentuk fungsi diskriminan Menentukan 5 X7_2 0,775 Reliabel
nilai batas pemisah kedua kelompok. 6 X7_3 0,756 Reliabel
4. Melihat nilai dari of original grouped cases 7 X8_1 0,766 Reliabel
correctly classified dan cross validated grouped 8 X8_2 0,727 Reliabel
cases correctly classified. 9 X8_3 0,770 Reliabel
5. Uji signifikansi dilakukan untuk menganalisa 10 X9_1 0,763 Reliabel
model fungsi diskriminan yang terbentuk apakah 11 X9_2 0,775 Reliabel
cukup signifikan atau tidak. 12 X9_3 0,759 Reliabel
6. Menghitung tingkat ketepatan pengelompokan
Sumber : Diolah oleh peneliti
hasil prediksi fungsi diskriminan.
Berdasarkan uji reliabilitas sesuai Tabel 4.5
3.6.2 Langkah - Langkah Untuk Mencapai dapat dikatakan bahwa seluruh item reliabel. Ini bisa
Tujuan Kedua Yaitu dilihat dari keseluruhan item pertanyaan memiliki
1 Menentukan model regresi logistik antara
cronbach alpha diatas 0,60. Sehingga dapat ditarik
variabel respon dengan masing- masing variabel
kesimpulan bahwa pertanyaan penelitian ini reliabel.
independen secara individu.
4.4.1 Uji Multinormal
2 Menentukan model regresi logistik antara
Uji multinormal dilakukan untuk mengetahui
variabel respon dengan variabel-variabel apakah data yang digunakan sudah mengikuti distribusi
independen secara berganda. multinormal. Kriteria pemenuhan asumsi dilakukan
3 Melakukan pembentukan model dengan
secara visual yaitu jika plot q-q membentuk garis lurus
memasukkan variabel yang signifikan pada
berarti data dapat didekati sebaran normal (Johnson &
regresi logistik berganda.
Wichern 2007). Persebaran datanya dapat dilihat pada
4 Menguji kesesuaian model untuk mengetahui
Lampiran IV.
apakah model regresi logistik yang telah didapat
4.4.2 Uji Kesamaan Matrik Varian Kovarian
sudah sesuai atau tidak. Untuk menguji kesamaan matrik varian
5 Menginterpretasikan model regresi logistik yang
NRYDULDQ GLJXQDNDQ XML %R[¶V 0 +DVLO SHQJXMLDQ %R[¶V
telah diperoleh.
M sebesar 62,381 dan nilai p-value sebesar 0,164 yang
lebih besar dari signifikansi 0,05 maka terima H 0 yang
3.6.3 Langkah - Langkah Untuk Mencapai
Tujuan Ketiga Yaitu berarti grup covariance matrices adalah sama. Hal ini
Langkah yang digunakan adalah membandingkan berarti data diatas sudah memenuhi asumsi analisis
presentase obyek yang mampu dikelompokkan secara diskriminan, dengan demikian fungsi diskriminan yang
tepat dari masing ± masing metode. Metode yang terbentuk sudah sesuai untuk mengelompokkan
menghasilkan nilai ketepatan klasifikasi yang lebih besar konsumen.
dianggap lebih handal dalam mengelompokkan obyek. 4.4.3 Pembentukan Fungsi Diskriminan
Perbandingan juga dilakukan pada data untuk validasi. Fungsi diskriminan linier Fisher membuat
semacam persamaan regresi dan membaginya
4 PEMBAHASAN DAN PENERAPAN berdasarkan kode grup. Sehingga fungsi diskriminan
linier Fisher yang terbentuk berdasarkan output pada
4.1 Uji Validitas Variabel tabel Classification Function Coefficients dapat
Untuk mendapatkan data primer, peneliti mencirikan setiap kelompok adalah sebagai berikut:
menyebarkan kuesioner kepada konsumen sebanyak Fungsi diskriminan untuk yang berbelanja di pasar
100 responden. Sebelum melakukan penelitian lebih tradisional adalah
lanjut peneliti terlebih dahulu melakukan survei Z (0) 14,861 3,638 X 9
pendahuluan kepada 30 konsumen dengan beberapa Sedangkan Fungsi diskriminan untuk yang berbelanja
pertanyaan untuk menguji tingkat validitas. Nilai di pasar modern adalah
tabel Product Moment dapat diperoleh dimana df = Z (1) 28,947 5,137 X 9
n-2, dalam hal ini adalah jumlah sampel yang Fungsi diskriminan linier berdasarkan Z score
digunakan (n)=30, maka besarnya df=30-2=28. unstandardized yang terbentuk adalah
Dengan alpha 0,05 nilai r adalah 0,374. Berdasarkan
Z 6, 406 0,683 X 9
hasil penelitian bahwa semua pertanyaan pada
variabel produk, harga ,lokasi, dan promosi Hasil skor tersebut selanjutnya akan
dinyatakan valid. dibandingkan dengan cut off score, untuk mengetahui
apakah konsumen masuk ke kelompok layak atau tidak
4.2 Uji Reliabilitas Variabel layak. Karena banyaknya sampel antar kelompok 1 dan 0
Tabel 4.5 Hasil Uji Reliabilitas tidak sama, maka menggunakan persamaan:
No. Item &URQEDFK¶V $OSKD Keterangan N AZB NB Z A
Z cu
1 X6_1 0,769 Reliabel N A NB
2 X6_2 0,750 Reliabel Pada Tabel Function at Group Centroid didapatkan
3 X6_3 0,777 Reliabel angka centroid pada kelompok 0 adalah -1,082 dan untuk

6
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

kelompok 1 adalah 1,112. Dengan demikian perhitungan 4.6 Pembentukan Model


Z cu didapatkan nilai sebesar exp( 15, 009 1,923 X 3 (2) 1, 474 X 9 )
S ( x)
1 e xp( 15, 009 1,923 X 3 (2) 1, 474 X 9 )
38.1,112 37. 1, 082
Zcu 0, 0297
38 37 Model regresi logistik ditulis dalam bentuk logit menjadi
g ( x) ( 15,009 1,923 X 3 (2) 1, 474 X 9 )
4.5.1 Model Regresi Logistik Individu (Dengan
4.7 Uji Kesesuaian Model
Masing-Masing Variabel Bebas) g
(o n 'k S k )2 =3,329
Pembentukan model regresi logistik secara CÖ ¦ k
individu bertujuan untuk mengetahui variabel bebas k 1 n 'k S k (1 S k )

mana yang berpengaruh secara individu terhadap variabel Daerah penolakan H0: CÖ !$2(0,05;6) = 12,5916
respon, sebelum dilakukan pemodelan antara variabel DWDX QLODL SBYDOXH ! .. Dengan demikian H0 diterima.
respon dengan variabel-variabel bebas secara bersama- Kesimpulannya bahwa model sesuai atau tidak terdapat
sama. Untuk itu, perlu dilakukan pengujian signifikansi perbedaan yang nyata antara observasi dengan prediksi
parameter sebagai koefisien dari variabel bebas pada model.
masing-masing model individu. 4.9 Perbandingan Hasil kalsifikasi Analisis
Kesimpulan: Faktor-faktor yang berpengaruh Diskriminan dan Regresi Logistik
secara individu terhadap pemilihan tempat berbelanja Hasil ketepatan klasifikasi data learning untuk
konsumen adalah produk (X6), harga (X7), dan promosi analisis diskriminan adalah 86,7%. Sedangkan untuk
(X9). Hal ini terlihat dari nilai W pada masing-masing peluang kesalahan klasifikasi digunakan ukuran Apparent
variabel tersebut lebih besar dari nilai F(2df ,D ) 3,841. Error Rates (APER).
Sehingga keputusannya tolak H0. Langkah selanjutnya n01 n10 5 5
APER 0,13
adalah menginterpretasikan model tersebut. n0 n1 38 37
4.5.2 Model Regresi Logistik Berganda Presentase kebenaran keseluruhan yang
Meskipun dari pemodelan regresi logistik dihasilkan pada data testing sebesar 76,0%, sedangkan
individu telah diketahui bahwa variabel produk, harga, data learning sebesar 86,7%. Oleh karena itu model dapat
dan, promosi berpengaruh secara signifikan terhadap dikatakan sudah valid. Nilai APER pada data testing
variabel respon, namun belum diketahui bagaimana adalah sebesar
hubungan antara variabel lain. Karena jika ternyata n01 n10 2 4
hubungannya sangat erat, maka dimungkinkan salah satu APER 0, 24
n0 n1 9 16
variabel akan menjadi tidak signifikan lagi pengaruhnya
terhadap variabel respon. Oleh karena itu, perlu 2. Hasil Klasifikasi Pada Regresi Logistik
dilakukan pemodelan regresi logistik dengan Hasil ketepatan klasifiaksi data learning pada
memasukkan semua variabel secara bersama-sama untuk regresi logistik adalah 88%, sehingga
memeriksa ada atau tidaknya hubungan antara variabel n01 n10 4 5
APER 0,12
tersebut. Untuk mengetahui apakah parameter-parameter n0 n1 38 37
model telah signifikan atau tidak maka dilakukan Presentase ketepatan klasifikasi secara
langkah-langkah pengujian hipotesis sebagai berikut keseluruhan pada data testing juga cukup besar yaitu
1.Uji Serentak 80%. Nilai APER pada data testing adalah sebesar
Dari hasil analisis diperoleh nilai )DEPQJC adalah n01 n10 3 2
APER 0, 20
VHGDQJNDQ $2(14;0,05) = 23,6848. Karena nilai n0 n1 9 16
2
)DEPQJC > ï14;0,05 maka tolak *0 , yang berarti paling tidak Hasil perbandingan presentase ketepatan klasifikasi
ada satu variabel yang berpengaruh atau mempunyai antara analisis regresi logistik dan analisis diskriminan
kontribusi terhadap model. menunjukkan bahwa analisis regresi logistik lebih baik
2.Uji parsial untuk digunakan. Hal ini dikarenakan ketepatan
Untuk mengetahui pengaruh yang diberikan klasifikasi regresi logistik sebesar 80,0 persen dan
setiap variabel bebas, perlu dilakukan pengujian analisis diskriminan sebesar 76,0 persen. Regresi logistik
parameter secara parsial menggunakan uji Wald. Hasil uji juga memberikan selisih yang paling minimum antara
signifikansi parameter regresi logistik secara parsial data learning dan data testing. Jadi, metode analisis
dengan sembilan variabel bebas yang dapat diketahui regresi logistik dapat memberikan hasil klasifikasi yang
bahwa secara individu variabel yang signifikan lebih baik daripada analisis diskriminan.
berpengaruh terhadap pemilihan tempat berbelanja
konsumen adalah variabel pendidikan(X3)(2) dan variabel 5. KESIMPULAN DAN SARAN
promosi(X9), hal ini terlihat dari nilai W pada masing ± 1. Hasil analisis regresi logistik menunjukkan bahwa
masing variabel bebas X3 dan X9 lebih besar dari nilai variabel bebas yang secara signifikan berpengaruh
F(2df ,D ) =3,841 atau QLODL GDUL SBYDOXH . terhadap pemilihan tempat berbelanja adalah
pendidikan (X3) dan promosi (X9). Model yang
didapatkan untuk menggambarkan pola hubungan
antara variabel respon dan bebas adalah sebagai
berikut:

7
Perbandingan analisis diskriminan dan regresi logistic
(Studi kasus klasifikasi konsumen berdasarkan tempat berbelana di wilayah Taman-Sidoarjo)

exp( 15, 009 1,923 X 3 (2) 1, 474 X 9 ) [Online].termuat di:


S ( x) http://www.asparindo.com/berita- . [Diakses 3 april
1 e xp( 15, 009 1,923 X 3 (2) 1, 474 X 9 )
2013]
2. Hasil perbandingan presentase ketepatan klasifikasi
[12] Rohmawati, Shofi 2010. PERBANDINGAN
antara analisis diskriminan dan regresi logistik
ANALISIS REGRESI LOGISTIK DAN
menunjukkan bahawa analisis regresi logistik lebih
DISKRIMINAN PADA KASUS KECANDUAN
baik untuk digunakan, hal ini terlihat dari presentase
HANDPHONE (Studi Kasus SMA Kompleks
ketepatan pada regresi logistik untuk data learning
Surabaya) [Online]. Termuat di:
sebesar 88,0% dan untuk data testing sebesar
http://isjd.pdii.lipi.go.id/admin/jurnal/11208539543.
80,0%, sedangkan untuk analisis diskriminan
pdf . [Diakses: 9 Maret 2013]
ketepatan presentase untuk data learning adalah
[13] Setiati, Dwi 2012. Fungsi Pasar [Online].
sebesar 86,7% dan untuk data testing sebesar
Termuat di:
76,0%.
http://.wordpress.com/2012/06/05/fungsi-pasar/ .
5.2 Saran [Diakses: 14 mei 2013]
Bagi peneliti selanjutnya penting untuk [14] Sudaryanto. 2012. Analisis Diskriminan Marketing
mengembangkan penelitian ini dengan menggunakan Mix Terhadap Keputusan Pembelian Harian Pagi
variabel yang berbeda dan lebih banyak variabel bebas Radar Jember [Online]. Termuat di
yang dipergunakan, sehingga penemuan penelitian jurnal.unej.ac.id/index.php/BISMA/article/downloa
selanjutnya dapat menghasilkan penemuan-penemuan d/48/25 [Diakses: 13 Agustus 2013]
baru dengan harapan bisa melengkapi hasil penelitian ini. [15] Supranto J. 2004. Analisis Multivariat : Arti dan
Interpretasi. Jakarta : PT Asdi Mahasatya.
DAFTAR PUSTAKA
[1] Agresti, Alan. 1990. Categorical Data Analysis, John
Wiley and Sons, Inc, New York.
[2] Hair, JF. 2010. Multivariate Data Analysis. New
Jersey : Prentice Hall, Inc.
[3] Hosmer, D.W.dan Lemeshow, S. 2000. ³$SSOLHG
/RJLVWLF 5HJUHVVLRQ´, 2nd Edition, John Wiley and
Sons, Inc., New York.
[4] Indra, P. 2010. Faktor-faktor Yang Mempengaruh
Resiko Penyebab Kanker Payudara Dengan
Pendekatan Regresi Logistik [Online]. Termuat di:
http://digilib.its.ac.id/public/ITS-Undergraduate-
13440-Paper.pdf. [Diakses : 25 Agustus 2013]
[5] Johnson RA, Wichern DW. 2007. Applied
Multivariate Statistical Analysis. New Jersey :
Prentice Hall, Inc.
[6] Kitbumrungrat, Krieng 2012. Comparison Logistic
Regression and Discriminant Analysis in
classification groups for Breast Cancer [Online].
Termuat di:
http://paper.ijcsns.org/07_book/201205/20120518.pdf
. [Diakses : 9 maret 2013]
[7] Kurniati, Elvy,dkk. Perbandingan Hasil Klasifikasi
Analisis Diskriminan dan Regresi Logistik Respon
Biner Pada Pengklasifikasian Kejadian Bayi dengan
Berat Badan Lahir Rendah (BBLR) [Online]. Termuat
di:
http://dc347.4shared.com/doc/cUfpfzEa/preview.html
. [Diakses 9 maret 2013]
[8] Kotler Philip, Keller Kevin . 2009. Manajeme
pemasaran edisi 12. Jakarta : PT indeks.
[9] Morrison DF. 1967. Multivariate Statistical Methods.
New York Mc.Graw-Hill, Inc.2013]
[10] Permana, Aringga. 2010. Analisis Diskriminan Dua
Kelompok Untuk Mengetahui Seseorang Kecanduan
Facebook. Skripsi S1 Jurusan Matematika FMIPA
UNESA.
[11] Revitalisasi pasar tradisional sebagai upaya
menunjang aktivitas ekonomi masyarakat Sidoarjo

Anda mungkin juga menyukai