Anda di halaman 1dari 42

Multivariat

Discriminant Analysis
Minggu ke 5
Dani Leonidas S. ST,MT

Analisis Diskriminan

Merupakan salah satu tehnik multivariat


yang digunakan untuk mengestimasi
hubungan antara satu variabel dependen
nonmetrik (kualitatif, kategorikal) dengan
satu himpunan variabel independen metrik
(kuantitatif)
Dalam analisis diskriminan, peneliti
mendefinisikan pengelompokkan setiap
obyek pengamatan ke dalam dua atau lebih
kelompok berdasarkan kriteria sejumlah
variabel independen.

Pendahuluan

Misalkan seorang peneliti menduga adanya perbedaan


antara konsumen yang sering berbelanja dengan
konsumen yang jarang berbelanja di toko A. Untuk
mengetahui variabel-variabel apa saja yang
menyebabkan timbulnya perbedaan tersebut, peneliti
kemudian mengembangkan beberapa variabel yang
harus dijawab beberapa konsumen yang berbelanja di
toko A
Analisis diskriminan dapat digunakan, dengan
menggunakan variabel dependen non metrik adalah
perilaku belanja konsumen (sering dan jarang),
sedangkan variabel independennya metriknya adalah
variabel-variabel yang mempengaruhi perilaku belanja
konsumen yang dikembangkan oleh peneliti

Tujuan Analisis Diskriminan

menguji apakah terdapat perbedaan yang signifikan


antara dua kelompok (atau lebih)
menentukan variabel independen mana saja yang paling
mampu menjelaskan perbedaan antar kelompok
membangun prosedur untuk menempatkan objek-objek
baru yang profilnya diketahui ke dalam salah satu dari
kelompok yang ada
menentukan kombinasi linier dari variabel-variabel
prediktor
untuk
memisahkan
kelompok-kelompok
dengan jalan memaksimasi variasi antar-grup (between
group) relatif terhadap variasi dalam grup (withingroup). Atau dengan kata lain objek-objek dalam
kelompok yang berbeda dipisahkan secara maksimal

Model Dasar dalam Analisis


Diskriminan
Analisis diskriminan melibatkan penurunan kombinasi
linier dari dua (atau lebih) variabel-variabel
independen yang akan membedakan (discriminate)
secara paling baik kelompok-kelompok yang telah
didefinisikan sebelumnya

Z =konstanta + b1X1 + b2X2 + b3X3 + +


b n Xn
di mana
Z = skor diskriminan
b = bobot diskriminan
X

= variabel prediktor (independen)

Perbandingan regresi dan


diskriminan
Analisis Regresi

Analisis Diskriminan

Variabel dependen berdistribusi


normal

Variabel dependen tetap


(kategorikal)

Variabel independen tetap (metrik)

Variabel independen berdistribusi


normal

Tujuan : menjelaskan dan


meprediksi nilai rata-rata populasi
variabel berdasarkan nilai variabel
independen yang telah diketahui dan
tetap

Tujuan : mencari kombinasi linear


dari variabel independen yang
meminimasi kemungkinan atau
probabilitas melakukan kesalahan
klasifikasi individu atau objek ke
dalam kelompoknya masing-masing

Suatu model formal di mana asumsi


pasti dibuat untuk mendapatkan
estimasi parameter yang memiliki
properti statistik yang diinginkan

Suatu strategi untuk mencari alat


pengelompokan individu atau objek
secara akurat

Asumsi Dasar analisis diskriminan

Variabel independen harus berdistribusi


normal multivariat
Pengujian normalitas dapat dilakukan
dengan beberapa metode seperti membuat
histogram data dan membandingkannya
dengan histogram distribusi normal, cara
lainnya membuat normal probability plot
Melakukan uji Shapiro-Wilks atau
Kolmogorov-Smirnov
Matrik variansi kovariasi dari variabelvariabel independen dalam masing-masing
kelompok adalah sama

Karakteristik data yang dapat


mempengaruhi analisis diskriminan

Multikolinearitas
Yaitu dua atau lebih variabel independen berkolerasi
tinggi, akibat suatu variabel independen dapat
dijelaskan atau diestimasi oleh variabel independen
lainnya. Hal ini akan mengurangi daya pembeda
keseluruhan variabel independen dalam model
diskriminan
Ukuran sampel
Studi mensyaratkan bahwa perbandingan minimum
antara jumlah variabel independen dengan jumlah
sampel adalah 1 : 5. Bahkan lebih disarankan agar
penggunaan analisis diskriminan ini dapat mencapai 1
: 20.

Menentukan tujuan analisis


diskriminan

Analisis ini akan sangat bermanfaat


manakala peneliti memang tertarik
untuk memahami perbedaan yang
terjadi antar kelompok dan
selanjutnya memprediksi bagaimana
mengelompokkan suatu objek ke
dalam kelompok tersebut

Menentukan Desain Penelitian yang


Relevan

Menentukan variabel dependen dan


independennya
Jumlah variabel dependen boleh dua atau
lebih tetapi harus mutually exclusive
(sering, dan jarang)
Peneliti dapat juga mengikut sertakan
variabel dependen perantara yang biasanya
bertindak sebagai peralihan antar variabel
dependen (sering, kadang-kadang dan
jarang)
Variabel independen dikembangkan melalui
eksplorasi atau konfirmatory

Desain Penelitian

Menentukan Ukuran Sampel


Dianjurkan agar menggunakan rasio lima
observasi untuk setiap variabel independen
atau sejumlah 20 sampel untuk setiap
kelompok variabel dependen
Pemilahan Sampel
Sampel biasanya dipilah menjadi dua yaitu
analisis sample (untuk keperluan
membangun fungsi diskriminan) dan hold
out sample (untuk keperluan validasi)

Estimasi Model Diskriminan

a.

b.

Hitung nilai Z (discriminant score) untuk


setiap objek, metode yang dapat digunakan
:
Simultaneous Estimation
semua variabel independen diinput secara
bersamaan untuk membentuk model tanpa
mempertimbangkan daya pembeda antar
variabel
Stepwise Estimation
variabel independen diinput satu persatu ke
dalam model berdasarkan daya
pembedanya

Kriteria Seleksi Variabel dalam


Metode Stepwise

Minimasi Wilks Lambda


Raos V
Mahalanobis Distance
Between-Group F
Sum of Unexplained Variance

Analisis perbedaan antar kelompok

Dilakukan sebelum melakukan salah satu di antara


kedua metode (stepwise atau simultaneous)
Lakukan pemeriksaan statistik univariat untuk
mengetahui adanya perbedaan antar kelompok
Jika tingkat signifikansi suatu variabel independen
adalah lebih kecil dari 0,05; maka hipotesis bahwa
semua mean kelompok untuk variabel independen
tersebut adalah sama ditolak.
Statistik lain, Wilks Lambda. Lambda merupakan rasio
antara within group sum of square terhadap total sum
of square (semakin besar nilai lambda, semakin tidak
berbeda mean kelompok)

Pembuatan model diskriminan

Untuk mengukur signifikansi model


dapat digunakan beberapa kriteria,
namun khusus untuk metode
stepwise biasanya digunakan
Mahalanobis.

Pengelompokkan objek ke dalam


kelompok yang sesuai

Objek dikelompokkan
berdasarkan Cutting
score dengan
persamaan sbb:
N AZ B N B Z A
2
Z CE Cutting Score
N A Jumlah objek kelompok A

Z A ZB
2
Z CE Cutting Score
Z A Centroid kelompok A

Z CE

Z CE

Z B Jumlah objek kelompok B

Z B Centroid kelompok B

Berlaku untuk dua kelompok


dengan jumlah objek berbeda

Berlaku untuk dua kelompok


dengan jumlah objek sama

Membuat matriks klasifikasi

Setiap objek dikelompokkan ke dalam


kelompok yang sesuai
Objek masuk ke kelompok A jika Zn
< Zcu
Objek masuk ke kelompok B jika Zn
> Zcu
Zn = Nilai Z diskriminan objek ke-n
Zct = cutting score

Penentuan akurasi klasifikasi objek

Proportional chance criterion

Akurasi pengelompokkan dinyatakan baik jika nilai Cpro


lebih besar daripada nilai maximum chance criterion
Cpro = p2 + (1-p)2
dimana p = proporsi objek dalam kelompok 1, dan 1-p =
proporsi objek dalam kelompok 2

Presss Q statistic

Klasifikasi dinyatakan tepat jika nilai Q lebih besar


daripada nilai kritis
Nilai kritis didapat dari tabel chi square dengan degree of
freedom 1 dan tingkat signifikansi tertentu

( N ( nXK ))2
Q
N( K 1)
N Jumlah sampel keseluruhan
n Jumlah objek yang diklasifikasikan secara tepat
K Jumlah kelompok

Interpretasi hasil analisis

Beberapa metode yang dapat digunakan :


Discriminant Weight
(Lihat output SPSS dengan label
Standardized Canonical Discriminant
Function)
Discriminant Loading
(Lihat out put SPSS dengan label Structure
Matrix)
Partial F Values
Semakin besar nilai F, menunjukkan daya
pembeda yang semakin besar

Validasi hasil analisis

1.

2.

3.

Terdapat beberapa cara untuk memvalidasi hasil output


diskriminan
Membandingkan dengan probabilitas asal
Membandingkan jumlah individu yang berhasil
diklasifikasikan benar dengan berapa individu yang salah
diklasifikasikan
Metode jack-knife
Menghitung angka hit ratio rata-rata yang diperkirakan
dapat menggambarkan hit ratio sesungguhnya dari
populasi
Metode hold out
Sample dibagi 2, dimana satu bagian digunakan untuk
menurunkan fungsi diskriminan dan satu bagian lainnya
digunakan untuk menguji seberapa baik fungsi diskriminan
yang dihasilkan dari nilai hit ratio

Kasus HATCO

Tujuan Manajerial
Dengan menggunakan analisis diskriminan,
maka dapat diketahui faktor-faktor yang
dapat membedakan antara cluster dan
diperhatikan oleh konsumen.
Faktor-faktor yang diperoleh dapat
digunakan untuk mendeskripsikan
preferensi konsumen dengan klusterkluster berbeda dan meningkatkan kinerja
perusahaan

Dasar Pemilihan Variabel

Dalam menentukan faktor-faktor yang paling


berpengaruh dalam keputusan pembelian, maka
terlebih dahulu untuk menyederhanakan
permasalahan maka obyek diteliti (konsumen)
sebaiknya dikelompokkan menurut karakteristik yang
mirip.
Dengan demikian permasalahan yang dibahas
menjadi lebih sederhana tanpa menyebabkan
kesalahan atau ketidak tepatan intepretasi
Hasil dari dari analisis cluster sebelumnya dapat
digunakan untu menyederhanakan permasalahan
Faktor-faktor yang diamati adalah persepsi konsumen
terhadap HATCO

Variabel Yang Digunakan

Variabel-variabel explanatory (independen)


yang digunakan dalam analisis diskriminan,
antara lain:
X1 (Delivery Speed)
X2 (Price Level)
X3 (Price flexibility)
X4 (Manufactures Image)
X5 (Overall service)
X6 (Salesforce image)
X7 (Product quality)

Variabel yang digunakan

Namun variabel-variabel diatas telah


dikelompokkan dengan menggunakan
analisis faktor untuk mencegah
multikolinearitas antar variabel
Hasil analisis faktor sebelumnya akan
digunakan

Hasil analisis faktor sebelumnya

Diperoleh 2 faktor (variabel independen)


Faktor 1 mencangkup persepsi konsumen
yang dapat disebut performansi, sedangkan
faktor 2 berhubungan dengan image (citra)
perusahaan,
Selain itu, variabel x5 akan dimasukkan ke
dalam variabel independen untuk
mengetahui apakah variabel tersebut
berpengaruh signifikan terhadap variabel
dependen

Hasil analisis cluster sebelumnya

Cluster konsumen dari hasil analisis


cluster sebelumnya (dimasukkan
sebagai variabel dependen)

Pemenuhan Asumsi

Variabel independen berdistribusi normal multivariat


Uji kolmogorov-smirnov dan normal probability plot
(sudah dilakukan pada analisis faktor sebelumnya)
Tidak adanya multikolinearitas
Dengan menggunakan variabel independen dari hasil
analisis faktor maka permasalahan multikolinearitas
tidak mungkin timbul dalam masalah analisis
diskriminan
Matrik variansi-kovariansi dari variabel-variabel
independen dalam masing-masing kelompok adalah
sama
Pengujian asumsi diatas dengan menggunakan
pengujian box M

Pengujian Box M
Test Results
Box's M
F

Approx.
df1
df2
Sig.

7.996
7.912
1
25129.795
.005

Tests null hypothesis of equal population covariance matrices.

Dengan signifikansi =0,05, maka dapat disimpulkan


bahwa tidak terdapat cukup bukti untuk
Menolak hipotesis awal bahwa terdapat kesamaan variansi
kovariansi

Intepretasi Hasil

Variabel Yang berpengaruh dalam model


Nilai sig wilks lambda < level of significance (0,05) maka hanya
variabel-variabel tersebut yang berpengaruh dalam hasil analisis
diskriminan
Tolerance diatas menunjukkan adanya multikolinearitas antar sesama
variabel sehingga dapat merepresentasikan satu sama lain.
Pada hasil variables in the analysis hanya memasukkan step pertama
dengan factor score 1 = hanya factor score 1 yang berpengaruh dalam
penentuan cluster
Variables in the Analysis
Step
1

REGR factor score


1 for analysis 1

Tolerance

Sig. of F to
Remove

1,000

,000

Nilai Wilks Lambda

Ditentukan variabel yang masuk ke dalam model dengan


melihat variansi yang dapat dijelaskan oleh variabelvariabel yang masuk ke dalam model yang diwakili
melalui nilai signifikansi
Jika nilai signifikansi < 0,05 maka variabel tersebut
masuk ke dalam model analisis diskriminan
Wilks' Lambda

Step
1

Number of
Variables
1

Exact F
Lambda
.382

df1

df2
1

df3
1

98

Statistic
158.327

df1
1

df2
98.000

Sig.
.000

Validasi Model Analisis Diskriminan


Classification Resultsb,c

Original

Count
%

Cross-validated a

Count
%

Ward Method
1
2
1
2
1
2
1
2

Predicted Group
Membership
1
2
51
10
2
37
83.6
16.4
5.1
94.9
51
10
2
37
83.6
16.4
5.1
94.9

Total
61
39
100.0
100.0
61
39
100.0
100.0

a. Cross validation is done only for those cases in the analysis. In cross
validation, each case is classified by the functions derived from all cases
other than that case.
b. 88.0% of original grouped cases correctly classified.
c. 88.0% of cross-validated grouped cases correctly classified.

validasi

Dengan menggunakan classification


result maka dapat dilihat kesesuaian
model terhadap pembentukkan
cluster
Hasil menunjukkan bahwa 88%
jumlah observasi benar
dikelompokkan

Pengujian Kelayakan Model

Dilakukan uji Press Q untuk mengetahui


keakuratan hasil model analisis diskriminan
Rumus :

N nK
Press' sQ
N K 1

N = Jumlah Sample
n = Jumlah observasi yang benar dikelompokkan
K = Jumlah grup

Perhitungan nilai presssQ

N = 100
n = 88%
K=2
Nilai kritis (dari tabel chi square)
untuk signifikansi 0,01 = 6,63
PresssQ = 57,6 > 6,63
Dapat disimpulkan bahwa klasifikasi
dapat dinyatakan tepat (nilai PresssQ
> nilai kritis)

Fungsi Kanonik Analisis Diskriminan

Fungsi kanonik merupakan fungsi yang menjelaskan


hubungan antara variabel dependen dengan variabel
independen yang menggunakan nilai yang telah
distandarisasi
Dari tabel dibawah, diperoleh fungsi untuk analisis
diskriminan, yaitu
Cluster = 1,609 factor score 1
Canonical Discriminant Function Coefficients
Function
1
REGR factor score
1 for analysis 1
(Constant)

1.609

Unstandardized coefficients

.000

Fungsi kanonik

Fungsi kanonik hanya berfungsi untuk


mengelompokkan variabel baru ke
dalam cluster yang telah ada dan
tidak dapat menambahkan kluster
yang baru

Penggunaan fungsi kanonik

Dalam mengelompokkan sebuah


obyek baru ke dalam kluster yang
telah ada dapat dilakukan dengan
beberapa cara:
Fungsi Fisher (lebih besar sama
dengan 2 buah tipe kategori)
Fungsi kanonik teritorial map (lebih
besar dari 2 tipe kategori)

Fungsi fisher

Fungsi fisher digunakan untuk


mengelompokkan konsumen baru ke dalam
salah satu cluster
Fungsi yang terbentuk :
Cluster 1 = (-1,619 X fac Scr 1) -1,199
Cluster 2 = (2,532 X fac Scr 1) 1,931
Classification Function Coefficients
Ward Method
1
2
REGR factor score
1 for analysis 1
(Constant)

-1.619

2.532

-1.199

-1.931

Fisher's linear discriminant functions

Contoh pengelompokkan
Coef Comp 1

kuesioner

Nilai Factor Score 1

X1

-0.787

-1.574

X2

0.714

1.427

X3

-0.804

-3.21

X4

0.102

0.71

X6

0.025

0.22

x7

0.764

2.29
-0.126

keterangan

Nilai koef komp 1 didapat dari hasil


analisis faktor
Nilai koef komp 1 dikalikan dengan
jawaban kuesioner oleh obyek baru
Hitung fungsi fisher untuk kedua
cluster, obyek baru akan dimasukkan
kedalam cluster yang memiliki nilai
fungsi fisher terbesar

Perhitungan fungsi fisher

Cluster 1 = (-1,619 X factor score 1)


1,199 = -0,9950
Cluster 2 = (2,532 X factor score 1)
1,931 = -2,250
Nilai func 1 > func 2
Konsumen tersebut dapat
dimasukkan ke dalam cluster 1

Anda mungkin juga menyukai