Anda di halaman 1dari 18

I.

PENDAHULUAN
Analisis multivariate dikelompokkan menjadi dua kelompok yaitu kelompok dependesi di
mana variabel dikelompokkan menjadi variabel bebas yang mempengaruhi dan variabel tak
bebas yang dipengaruhi. Kelompok dependensi membahas besarnya pengaruh dari perubahan
variabel bebas terhadap variabel tak bebas, kemudian meramalkan nilai variabel tak bebas
berdasarkan nilai variabel bebas yang sudah diketahui. Kelompok dependensi terdiri dari analisis
regresi linear berganda, analisis varian, analisis diskriminan, analisis konjoin, korelasi kanonikal
dan SEM (structural equation modeling). Kelompok interdependensi di mana variabel tidak
dibedakan menjadi bebas dan tak bebas, variabel mempunyai derajat/tingkat yang sama.
Kelompok interdependensi membahas mengenai pengelompokkan / pengklasifikasian /
pengklasteran. Kelompok ini terdiri dari analisis faktor, analisis klaster (cluster analysis),
penskalaan multidimensional, analisis korespondensi.
Makalah ini akan menjelaskan konsep analisis diskriminan, tujuannya, aplikasi /
penggunaannya, prosedur atau langkah-langkah yang harus diperhatikan di dalam melakukan
analisis diskriminan, meliputi perumusan masalah, memperkirakan koefisien fungsi diskriminan,
menentukan signifikasi, interpretasi, dan validasi; membahas analisis diskriminan ganda (lebih
dari dua kelompok/kategori), menjelaskan stepwise analisis diskriminan dan menjelaskan
prosedur Mahalanobis W.
II. PEMBAHASAN
II.1. Konsep Dasar dan Tujuan Analisis Diskriminan
Analisis diskriminan merupakan teknik menganalisis data, kalau variabel tak bebas
(disebut criterion) merupakan kategori (non-metrik, nominal atau ordinal, bersifat kualitatif)
sedangkan variabel bebas sebagai prediktor merupakan metric (interval atau rasio, bersifat
kuantitatif). Misalnya, variabel tak bebas merupakan pilihan 3 merek komputer pribadi (personal
computer), yaitu merek A, B, dan C dan variabel bebasnya merupakan penilaian atribut (rating
of attributes) dari PC dengan menggunakan skala likert 5 butir, misalnya dari 1= sangat tidak
bermutu sampai 5= sangat bermutu.
Tujuan analisis diskriminan:
1. Membuat suatu fungsi diskriminan atau kombinasi linear, dari prediktor atau variabel
bebas yang bisa mendiskriminasi atau membedakan kategori variabel tak bebas atau
criterion atau kelompok, artinya mampu membedakan suatu objek (responden) masuk
kelompok kategori yang mana.
2. Menguji apakah ada perbedaan signifikan antara kategori/kelompok, dikaitkan dengan
variabel bebas atau prediktor.
3. Menentukan prediktor/variabel bebas yang mana memberikan sumbangan terbesar
terhadap terjadinya perbedaan antar-kelompok.
4. Mengklarifikasi/mengelompokkan objek/kasus atau responden ke dalam suatu
kelompok/kategori didasarkan pada nilai variabel bebas.
(pelanggan memilih komputer merek A? B? atau C?, ada 3 kelompok/kategori).
5. Mengevaluasi keakuratan klasifikasi (the accuracy of classification).

Teknik analisis diskriminan dibedakan menjadi dua yaitu analisis diskriminan dua
kelompok/kategori, kalau variabel tak bebas Y dikelompokkan menjadi dua. Diperlukan satu
fungsi diskriminan. Kalau variabel tak bebas dikelompokkan menjadi lebih dari dua kelompok
disebut analisis diskriminan berganda (multiple discriminant analysis) diperlukan fungsi
diskriminan sebanyak (k 1) kalau memang ada k kategori.
Misalnya hanya ada 2 merek A dan B cukup 1 fungsi diskriminan D, tetapi kalau ada 3
merek A, B, dan C diperlukan 2 fungsi diskriminan (3 1 = 2) katakan D1 dan D2.
Teknik analisis diskriminan dapat untuk menjawab pertanyaan berikut.
1.

Dinyatakan dalam karakteristik demografi, bagaimana pelanggan yang loyal bisa


dibedakan dengan yang tidak loyal?

2.

Apakah peminum berat, medium, dan ringan dari soft drink berbeda kalau dinyatakan
dalam konsumsi makanan beku?

3.

Karakteristik psikografik apa yang bisa membantu membedakan mendiskriminasi antara


pembeli di pasar swalayan Hero yang sensitif terhadap harga dan yang tidak?

4.

Apakah di berbagai segmen pasar berbeda di dalam kebiasaan menggunakan media


promosi?

5.

Dinyatakan dalam gaya hidup, apakah ada perbedaan antara pelanggan pasar tradisional
dan pasar modern, kalau ada variabel apa saja yang bisa membedakan/mendiskriminasi
secara signifikan.

6.

Seorang direktur kredit suatu bank ingin mengetahui apakah seorang nasabah peminta
kredit, merupakan nasabah yang jujur atau tidak jujur berdasarkan beberapa catatan
tentang karakteristik/atribut pribadi dari nasabah tersebut.

7.

Seorang direktur personalia suatu perusahaan suatu perusahaan ingin mengetahui apakah
seorang sarjana yang mengajukan lamaran merupakan calon karyawan yang mempunyai
komitmen pada perusahaan atau tidak berdasarkan beberapa data pribadi pelamar
tersebut.

8.

Seorang dokter penyakit dalam bisa menggunakan catatan tekanan darah, berat badan,
kolesterol dan atribut tentang kesehatan lainnya, untuk membedakan pasien yang
kemungkinan besar akan terkena serangan jantung dan yang tidak.

II.2.

Hubungan Analisis Diskriminan dengan Anova dan Regresi Linier Berganda

Tabel 1 menunjukkan hubungan antara analisis diskriminan dengan regresi berganda dan
analisis varian. Kita menjelaskan hubungan ini dengan suatu contoh di mana peneliti mencoba
menjelaskan jumlah asuransi jiwa yang dibeli menurut umur dan pendapatan (the amount of life
insurance purchased in terms of age and income). Seluruh tiga prosedur melibatkan suatu
criteria tunggal atau variabel tak bebas dan prediktor atau variabel bebas ganda (multiple
predictor). Walaupun demikian sifat variabel ini berbeda.
Di dalam analisis varian dan regresi berganda, variabel tak bebas Y merupakan data
metric atau interval (jumlah asuransi yang dibeli dalam satuan mata uang, US$, Rp, Yen,
Poundsterling), sedangkan di dalam analisis diskriminan merupakan data kategorikal (jumlah
asuransi yang dibeli diklarifikasikan menjadi: tinggi, medium, rendah = tiga kategori).
Variabel bebas berupa data kategori (non-metrik) dalam hal analisis varian (umur dan
pendapatan dikelompokkan menjadi kelompok: tinggi, medium, dan rendah) dan berupa data
metrik dalam hal analisis regresi dan diskriminan (umur dalam tahun, pendapatan dalam satuan
mata uang). Di dalam analisis regresi berganda kita meramalkan nilai Y (kuantitatif berupa
angka), di dalam analisis diskriminan kita meramalkan suatu objek/elemen/kasus/responden,
masuk kelompok (kategori) yang mana?
Analisis diskriminan dua kelompok, di mana variabel tak bebas Y hanya mempunyai dua
kategori, sama dengan analisis regresi linear berganda di mana variabel tak bebas Y merupakan
variabel dummy dengan nilai 0 atau 1, menghasilkan koefisien regresi parsial yang proporsional
dengan koefisien fungsi diskriminan.
Tabel 1
Persamaan dan Perbedaan Antara Analisis Varian (Anova), Analisis Regresi dan Analisis
Diskriminan
Persamaan
Anova
Regresi
Diskriminan
Banyaknya variabel
Satu
Satu
Satu
tak bebas (Y)
Banyaknya variabel
bebas (X)

Banyak (> 1)

Banyak (> 1)

Banyak (> 1)

Perbedaan sifat
variabel tak bebas (Y)

Metrik
(kuantitatif)

Metrik
(kuantitatif)

Kategori
(kualitatif)

Sifat variabel bebas


(X)

Kategori
(kualitatif)

Metrik
(kuantitatif)

Metrik
(kuantitatif)

II.3.

Model Analisis Diskriminan dan Statistik yang Relevan

Model analisis diskriminan berkenaan dengan kombinasi linear yang bentuknya sebagai berikut.
Di

= bo + b1Xi1 + b2Xi2 + b3Xi3 + bjXij + + bkXik

Dimana:
Di

= nilai (skor) diskriminan dari responden (objek) ke-i.


i

Xij

= 1, 2, , n. D merupakan variabel tak bebas.

= variabel (atribut) ke-j dari responden ke-i.


variabel bebas/prediktor ke-j dari responden ke-I, juga disebut atribut, seperti
disebutkan di atas.

bj

= koefisien atau timbangan diskriminan dari variabel atau atribut ke-j.

Koefisien atau timbangan (weight) fungsi diskriminan bj diperkirakan sedemikian rupa sehingga
kelompok (kategori) mempunyai nilai fungsi diskriminan (skor) yang sangat berbeda. Kalau ada
dua kategori A dan B, nilai/skor fungsi diskriminan dari kelompok yang satu (A) sangat berbeda
dengan kelompok ke dua (B). Kalau ada 3 kelompok A, B, dan C. Nilai fungsi diskriminan
kelompok A sangat berbeda dengan B dan sangat berbeda dengan kelompok C.
Ini terjadi kalau rasio sum of squares antara kelompok dengan sum of squares dalam
kelompok untuk nilai/skor fungsi diskriminan maksimum atau rasio varian antar-kelompok
dengan varian dalam kelompok sebesar mungkin (maksimum). Objek dalam kelompok homogen
atau relatif homogen, sedangkan antar-kelompok sangat heterogen. Setiap kombinasi linear
prediktor lainnya akan memberikan nilai rasio yang lebih kecil.
Statistik yang relevan dengan analisis diskriminan:
1. Korelasi kanonikal (canonical correlation), mengukur seberapa kuat asosiasi antara skor
diskriminan dan kelompok, merupakan ukuran antara fungsi diskriminan tunggal dan set
variabel dummy yang membentuk anggota kelompok.
2. Centroid ialah rata-rata nilai skor fungsi diskriminan untuk suatu kelompok tertentu.
Banyaknya centroid sebanyak kelompok yang ada, sebab setiap kelompok mempunyai
satu centroid. Rata-rata untuk satu kelompok pada semua fungsi disebut centroid
kelompok (group centroids).
3. Metrik klasifikasi, sering disebut metrik kebingungan atau prediksi (confusion or
prediction metric), memuat jumlah objek (kasus) yang secara benar terklarifikasi dan
yang salah terklarifikasi. Objek (kasus) yang terklarifikasi secara benar tampak pada
diagonal, sebab kelompok yang diramalkan dan yang sebenarnya sama, sedangkan yang
berada di luar diagonal (off diagonal) mewakili objek yang terklarifikasi secara salah (tak
benar). Banyaknya objek yang berada di diagonal dibagi dengan banyaknya objek (kasus)
yang diteliti disebut hit ratio.

4. Koefisien fungsi diskriminan yang tidak dibakukan (unstandardized) merupakan


pengganda variabel (multipliers of variables), ketika variabel masih dalam satuan ukuran
yang asli. Kalau variabel dibakukan disebut koefisien beta (beta koefisien).
5. Skor diskriminan. Koefisien yang tidak dibakukan dikalikan nilai variabel, dijumlahkan
kemudian dengan konstan akan diperoleh nilai atau skor diskriminan. Jadi, skor
diskriminan dengan nilai fungsi diskriminan.
6. Eigenvalue. Untuk setiap fungsi diskriminan, eigenvalue merupakan rasio sum of squares
(SS) antara kelompok dengan (SS) dalam kelompok (SSb/SSw). Semakin besar nilai
eigenvalue, semakin bagus fungsi diskriminan (semakin superior).
7. Nilai F dengan signifikannya. Nilai ini dihitung dari tabel anova satu arah, dengan
pengelompokkan variabel sebagai variabel bebas yang kate-gorikal (kualitatif).
Signifikan F = P (F F0) = p
Kalau p a, Ho ditolak, tetapi kalau p > a
Ho diterima, di mana Ho : B1 = B2 = = Bk = 0
H o : Bj 0
atau bisa juga menggunakan tabel F.
Kalau Fo Fa(V1, V2), Ho ditolak, akan tetapi
Kalau Fo < Fa(V1, V2), Ho diterima
Fa(V1, V2), diperoleh dari tabel F dengan df = V1, V2
Catatan: Di dalam analisis varian satu arah, setiap prediktor berperilaku sebagai variabel
tak bebas, serupa metrik.
8. Rata-rata kelompok dan simpangan baku (standard deviasi) kelompok. Setiap kelompok
terdapat prediktor, yang harus dihitung rata-ratanya dan standard deviasinya.
katakan Xj dan Sj untuk kelompok j, di mana j = 1, 2, , k.
Kalau nj = n (banyaknya elemen sampel kelompok k),
Xj = Xij/n dan S2j = (Xij Xj)2/(n-1) Sj = S2j
9. Matrix korelasi dalam kelompok yang digabung (pooled within-group correlation
metric), dihitung dengan merata-ratakan metric kovarian yang terpisah untuk seluruh
kelompok.
10. Koefisien fungsi diskriminan yang dibakukan (standardized), ialah koefisien yang
dipergunakan sebagai pengganda (multipliers), kalau semua variabel telah dibakukan
sehingga masing-masing variabel mempunyai rata-rata nol dan standard deviasi satu (0
dan 1).

11. Korelasi struktur (structure correlation) disebut juga discrimination loading , merupakan
korelasi linear sederhana (bivariate) antara variabel bebas (prediktor) dengan fungsi
diskriminan.
12. Metrik korelasi menyeluruh (total correlation metric). Apabila elemen/objek/kasus
diperlakukan seolah-olah berasal dari satu sampel, kemudian korelasi dihitung, maka
akan diperoleh total correlation metric.
13. Wilks (disebut juga statistic), untuk setiap prediktor, merupakan rasio dari within
group sum of squares dengan total sum of squares, yang nilainya antara 0 dan 1.
Kalau nilainya besar (mendekati 1) menunjukkan bahwa rata-rata antar-kelompok tidak
berbeda, sebaliknya kalau angkanya kecil (mendekati 0), rata-rata kelompok sangat berbeda,
artinya peneliti berhasil memperoleh fungsi diskriminan yang benar-benar bisa untuk
mendiskriminasi yaitu untuk menentukan suatu kasus (objek) akan masuk kelompok yang mana
(masuk kelompok A atau B) kalau hanya ada dua kelompok.
Asumsi dalam analisis diskriminan ialah bahwa setiap kelompok (group) merupakan
suatu sampel dari multivariate normal population dan setiap populasi mempunyai matix
kovarian yang sama.
II.4.
Proses Analisis Diskriminan
1. Dua Kelompok (Two Groups)
I
Rumuskan Masalah

II
III
IV

Buat perkiraan koefisien diskriminan


Tentukan signifikansi fungsi diskriminan
Buat interpretasi hasil hitungan

V
Langkah 1

Penilaian terhadap validitas analisis

Merumuskan Masalah

Langkah pertama dalam analisis diskriminan ialah merumuskan masalah (problem


formulation) dengan jalan mengenali:
1.

Tujuannya (the objective). Memasukkan objek/elemen ke dalam kelompok atau kategori


tertentu.

2.

Variabel tak bebas (dependent atau criterion), terdiri dari dua kelompok/kategori atau
lebih.

3.

Variabel bebas, ada berapa? Variabel bebas atau prediktor.

Perlu diketahui bahwa analisis diskriminan hampir sama dengan analisis regresi
berganda, hanya bedanya, variabel tak bebasnya berupa non-metrik atau kategori atau kelompok
bersifat kualitatif (bisa berupa skala nominal atau ordinal).
Untuk dua kelompok misalnya responden dikelompokkan menjadi dua pelanggan loyal
dan tak loyal; karyawan jujur dan tak jujur; perusahaan akan maju dan akan bangkrut, dan lain
sebagainya.
Apabila data untuk variabel tak bebas berupa data metric (interval atau rasio) harus
diubah dahulu.
Misalnya data tingkat kepuasan: sangat puas = 5, puas = 4, netral = 3, tak puas = 2,
sangat tidak puas = 1.
Kemudian ingin diubah menjadi 3 kelompok. Sangat puas = 5, puas = 4 dan 3, tidak puas
= 2 dan 1. Sikap terhadap pusat belanja (shopping center), di mana 1 sangat tidak senang sampai
dengan 7 = sangat senang, dikelompokkan menjadi 3, tidak senang = 1, 2, 3; senang = 4 dan
sangat senang = 5, 6, 7.
Penentuan variabel bebas (prediktor) harus didasarkan pada teori atau hasil penelitian
sebelumnya, akan tetapi untuk riset exploratory (riset tahap penjajagan), pengalaman peneliti
diperlukan sebagai pegangan untuk memilih variabel tak bebas untuk dimasukkan dalam fungsi
diskriminan.
Sampel responden kemudian dibagi menjadi dua bagian. Bagian sampel yang pertama
disebut estimasi atau sampel analisis (analysis sample) dipergunakan untuk membuat estimasi
(perkiraan) nilai koefisien fungsi diskriminan. Bagian yang kedua disebut holdout atau sampel
validasi (validation sample), dipergunakan untuk melakukan validasi (membuat valid atau
sahih), fungsi diskriminan. Kalau sampel cukup besar bisa dibagi menjadi dua, bagian pertama
untuk keperluan estimasi (estimation) dan bagian kedua untuk validasi (validation).
Apabila peran bagian pertama kemudian ditukar dengan peran bagian kedua, analisis
diulangi, yang dipergunakan untuk estimasi kemudian untuk validasi, ini yang disebut doube
cross validation.
Seringkali terjadi, distribusi banyaknya objek atau kasus di dalam sampel untuk estimasi
dan validasi mengikuti distribusi, di dalam seluruh sampel (sebelum dibagi dua). Sebagai contoh,
kalau seluruh sampel sebanyak 50% pelanggan loyal dan 50% pelanggan tak loyal, maka yang
terdapat dalam sampel untuk estimasi dan validasi juga sama, masing-masing 50% loyal dan tak
loyal.
Perlu ditekankan di sini bahwa validasi untuk koefisien diskriminan harus dilakukan
berkali-kali, yang jelas tidak cukup hanya sekali. Banyaknya objek (kasus) dalam masing-masing
bagian sampel tidak harus sama, bisa misalnya 25% dan 75% atau 40% dan 60%.

Sebagai contoh, analisis diskriminan dua kelompok (dua kategori) yang menjadi objek
(elemen) penelitian ialah rumah tangga yang mengunjungi suatu tempat rekreasi terkenal. Rumah
tangga dibagi dua, yaitu kelompok 1 yang dua tahun terakhir mengunjungi tempat rekreasi
dengan symbol/lambang 1 dan yang tidak 2. Semuanya ada 42 rumah tangga sebagai sampel
dibagi menjadi dua sampel yaitu sampel estimasin sebanyak 30 rumah tangga dan sampel
validasi 12 rumah tangga.
Sampel estimasi 30 rumah tangga di mana ada 15 yang berkode/berlambang 1 dan ada 15
rumah tangga yang berkode 2. Sama halnya dengan sampel validasi ada 12 rumah tangga di
mana ada 6 berkode 1 dan ada 6 berkode 2.
Lihat Tabel 2 dan 3.
Tabel 2
Informasi Kunjungan ke Tempat Rekreasi (Resort Visit): Sampel untuk Estimasi

Numbe
r

1
2
3
4
5
6
7
8
9
10
11
12
13
14

Numbe
r

Repor
t
Size
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Repor
t
Size

Annual

Attitud
e

Importance

Family

Toward

Attached to

Income
($000)
50.2
70.3
62.9
48.5
52.7
75.0
46.2
57.0
64.1
68.1
73.4
71.9
56.2
49.3

Travel

Family
Vacation
8
7
5
5
6
7
3
4
5
6
7
8
8
2

5
6
7
7
6
8
5
2
7
7
6
5
1
4

Age of

Amount

Household

Head of

Spent on

Size

Household

3
4
6
5
4
5
3
6
4
5
5
4
6
3

43
61
52
36
55
68
62
51
57
45
44
64
54
56

Family
Vacation
M(2)
H(3)
H(3)
L(1)
H(3)
H(3)
M(2)
M(2)
H(3)
H(3)
H(3)
H(3)
M(2)
H(3)

Age of

Amount

Annual

Attitud
e

Importance

Family

Toward

Attached to

Household

Head of

Spent on

Income

Travel

Family

Size

Household

Family

15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

($000)
62.0
32.1
36.2
43.2
50.4
44.1
38.3
55.0
46.1
35.0
37.3
41.8
57.0
33.4
37.5
41.3

5
5
4
2
5
6
6
1
3
6
2
5
8
6
3
3

Vacation
6
4
3
5
2
6
6
2
5
4
7
1
3
8
2
3

2
3
2
2
4
3
3
2
3
5
4
3
2
2
3
2

58
58
55
57
37
42
45
57
51
64
54
56
36
50
48
42

Vacation
H(3)
H(3)
L(1)
M(2)
M(2)
M(2)
L(1)
M(2)
L(1)
L(1)
L(1)
M(2)
M(2)
L(1)
L(1)
L(1)

Tabel 3
Informasi Kunjungan ke Tempat Rekreasi (Resort Visit): Sampel untuk Validasi
Numbe
r

Report
Size

Annual

Attitude

Importance

Family

Toward

Attached to

Household

Age of

Amount

Head of

Spent on

Income
Travel
Family
Size
Household
Family
($000)
Vacation
Vacation
1
1
50.8
4
7
3
45
M(2)
2
1
63.6
7
4
7
55
H(3)
3
1
54.0
6
7
4
58
M(2)
4
1
45.0
5
4
3
60
M(2)
5
1
68.1
6
6
6
46
H(3)
6
1
62.1
5
6
3
56
H(3)
7
2
35.0
4
3
4
54
L(1)
8
2
49.6
5
3
5
39
L(1)
9
2
39.4
6
5
3
44
H(3)
10
2
37.0
2
6
5
51
L(1)
11
2
54.5
7
3
3
37
M(2)
12
2
38.2
2
2
3
49
L(1)
Karakteristik/atribut rumah tangga sebagai variabel bebas (prediktor) ialah penghasilan /
pendapatan tahunan keluarga (dalam smu = satuan mata uang), sikap terhadap travel dengan
skala 9 butir di mana 1 sangat tidak senang/suka sampai dengan 9 sangat senang/suka terhadap

travel, pentingnya vakasi/liburan bagi keluarga (dimana 1 sangat tidak penting dan 9 sangat
penting), banyaknya anggota rumah tangga (berapa orang) dan umur kepala rumah tangga
(tahun).
Langkah II, III, dan IV

Mengestimasi Koefisien Fungsi Diskriminan

Begitu data tentang sampel untuk estimasi sudah tersedia, maka dengan menggunakan
program komputer seperti SPSS 21, koefisien fungsi diskriminan bisa dihitung.
Ada dua pendekatan, yaitu: direct method dan Stepwise discrimination analysis. Direct
method meliputi estimasi koefisien fungsi diskriminan di mana seluruh variabel bebas (predictor)
terlibat, maksudnya semua dimasukkan dalam analisis, secara simultan bersama-sama. Semua
variabel diikutsertakan dalam analisis, tanpa memperhatikan discriminating power. Pendekatan
ini tepat sekali, kalau berdasarkan penelitian (riset) sebelumnya atau model teoretis yang
diketahui peneliti menghendaki semua variabel harus diikutsertakan, walaupun ada kemungkinan
discriminating power-nya lemah. Metode yang kedua yaitu stepwise discriminant analysis,
variabel bebas/prediktor diikutsertakan secara berurutan (sequentially), didasarkan pada
kemampuannya untuk mendiskriminasi antar-kelompok. Pendekatan ini tepat sekali kalau
memang penelitian akan melakukan seleksi variabel-variabel mana saja yang discriminating
power-nya memang tinggi. Program komputer akan membantu melakukan perhitungan untuk
menyeleksi.
Dengan menggunakan program komputer, analisis diskriminan dua kelompok atau dua
kategori berdasarkan tabel 2 dan 3 menghasilkan pengolahan data seperti terlihat pada tabel 4.

Tabel 4
Hasil Analisis Diskriminan Dua Kelompok
(dgn menggunakan SPSS 21)
Group Statistics
Visit

Mean

Std. Deviation

Valid N (listwise)
Unweighted

Weighted

Income

60.5200

9.83065

15

15.000

Travel

5.4000

1.91982

15

15.000

Vacation

5.8000

1.82052

15

15.000

H_Size

4.3333

1.23443

15

15.000

Age

53.7333

8.77062

15

15.000

Income

41.9133

7.55115

15

15.000

Travel

4.3333

1.95180

15

15.000

Vacation

4.0667

2.05171

15

15.000

H_Size

2.8667

.91548

15

15.000

50.1333

8.27101

15

15.000

Age

Total

Income

51.2167

12.79523

30

30.000

Travel

4.8667

1.97804

30

30.000

Vacation

4.9333

2.09981

30

30.000

H_Size

3.6000

1.30252

30

30.000

51.9333

8.57395

30

30.000

Age

Tests of Equality of Group Means


Wilks' Lambda

df1

df2

Sig.

Income

.453

33.796

28

.000

Travel

.925

2.277

28

.143

Vacation

.824

5.990

28

.021

H_Size

.672

13.661

28

.001

Age

.954

1.338

28

.257

Summary of Canonical Discriminant Functions


Eigenvalues
Function

Eigenvalue

% of Variance

Cumulative %

Canonical
Correlation

1.762

100.0

100.0

.799

a. First 1 canonical discriminant functions were used in the analysis.

Wilks' Lambda
Test of Function(s)

Wilks' Lambda

.362

Standardized Canonical
Discriminant Function
Coefficients
Function
1
Income

.759

Travel

.084

Vacation

.221

H_Size

.458

Age

.217

Chi-square
25.907

df

Sig.
5

.000

Structure Matrix
Function
1
Income

.828

H_Size

.526

Vacation

.348

Travel

.215

Age

.165

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant
functions. Variables ordered by absolute size of correlation within function.

Canonical Discriminant
Function Coefficients
Function
1
Income

.087

Travel

.043

Vacation

.114

H_Size

.422

Age

.025

(Constant)

-8.049

Unstandardized coefficients

Functions at Group
Centroids
Visit

Function
1

1.282

-1.282

Unstandardized
canonical discriminant
functions evaluated at
group means

Classification Resultsa
Visit

Predicted Group Membership

Total

1
Count
Original
%

12

15

15

15

80.0

20.0

100.0

.0

100.0

100.0

a. 90.0% of original grouped cases correctly classified.

Koefisien fungsi diskriminan yang tidak dibakukan (unstandardized) juga disajikan.


Group centroids atau rata-rata kelompok, ternyata mempunyai nilai yang sama besarnya dengan
tanda yang berbeda DA = 1,29 dan DB = -1,29 di mana DA = D1 dan DB = D2.
Oleh karena nA = nB = 15. Maka nilai pemisah (cutting point) Do = DA + DB)/2 = (-1,29]/2
= 0, artinya kalau seorang turis (responden) mempunyai skor atau nilai diskriminan, katakana Di
untuk responden ke-i < 0 (negatif) masuk kelompok A atau kelompok 1 dan kalau Di > 0 (positif)
masuk kelompok B atau kelompok 2.
Koefisien fungsi diskriminan yang baku (standar) semua positif, sebagai berikut:
penghasilan = 0,74; travel = 0,10; liburan = 0,23; art (anggota rumah tangga) = 0,47 dan umur =
0,21. Ternyata yang pengaruhnya signifikan, karena nilai signifikan < = 0,05, lihat tabel 4 ialah
penghasilan, liburan, dan art, di mana masing-masing nilai signifikannya; 0,000; 0,021; dan
0,001 semuanya < = 0,05. Variabel baku mempunyai rata-rata nol dan standar deviasi atau
simpangan baku satu. Fungsi diskriminan yang baku, sebagai berikut.
D= 0,74X1 + 0,10X2 + 0,23X3 + 0,47X4 + 0,21X5 di mana X1 = penghasilan, X2 = travel, X3 =
liburan (vakasi), X4 = anggota rumah tangga (ART) dan X5 = umur.
Semua koefisien fungsi diskriminan yang baku (standar) bertanda positif, ini artinya
semua variabel bebas (prediktor) sebanyak 5 buah yang tercantum dalam fungsi diskriminan D,
mempunyai pengaruh yang positif, setiap mengalami kenaikan akan meningkatkan
discriminating power. Oleh karena sudah dibuat baku (standar), maka bisa disimpulkan bahwa
semakin besar nilai koefisien dari suatu variabel bebas, semakin besar discriminating power dari
variabel yang bersangkutan. Di dalam praktiknya peneliti akan menggunakan variabel yang
pengaruhnya signifikan. Ternyata setelah dilakukan pengujian hipotesis hanya ada 3 dari 5
variabel bebas tersebut yang pengaruhnya memang signifikan, yaitu:
X1 = penghasilan, X3 = liburan (vakasi), dan X4 = anggota rumah tangga, jadi:
D = 0,74 (penghasilan) + 0,23 (liburan) + 0,47 (anggota rumah tangga = a.r.t), sudah cukup
untuk melakukan pengelompokkan.
Penentuan mengenai kepentingan relatif (relative importance) dari masing-masing
prediktor, bisa dilihat dari contoh berikut: (Malhotra, Hlm. 569).

Langkah V

Menilai Validitas Analisis Diskriminan

Seperti telah dijelaskan sebelumnya, secara acak data dibagi menjadi dua sub-sampel,
yaitu sampel untuk mengestimasi disebut analysis sample dan yang kedua untuk membuat
validasi validation sample disebut juga holdout sample. Analisis sample untuk mengestimasi
koefisien fungsi diskriminan sedangkan validation sampel dipergunakan mengembangkan matrik
klasifikasi.
Timbangan diskriminan, diestimasi dengan menggunakan analisis sampel dikalikan
dengan nilai variabel prediktor di dalam holdout sample untuk menghasilkan skor (nilai)
diskriminan. Elemen sebagai objek penelitian (responden, seperti pelanggan) kemudian
diputuskan untuk dimasukkan ke dalam kelompok (group) tertentu berdasarkan skor (nilai)
diskriminan dan suatu aturan keputusan yang tepat. Sebagai contoh, di dalam analisis
diskriminan dua kelompok, suatu objek akan dimasukkan ke dalam kelompok tertentu yang
centroid-nya terdekat. The hit ratio atau persentase objek/kasus yang secara benar/tepat
diklasifikasikan. Kalau dia memang masuk kelompok A dimasukkan ke A, kalau memang masuk
kelompok B dimasukkan ke B. Hit ratio dihitung dengan jalan menjumlahkan seluruh elemen
yang berada pada diagonal pokok (utama) matrik klasifikasi dibagi dengan banyaknya
objek/elemen.
Perlu sekali membandingkan persentase objek yang benar/tepat diklasifikasi berdasarkan
analisis diskriminan, dengan persentase yang diperoleh secara kebetulan (by chance). Apabila
kelompok mempunyai objek yang sama banyak (the same sample size), persentase klasifikasi
yang tepat karena kebetualan ialah angka 1 (satu) dibagi dengan banyaknya kelompok (equal
chance). Seberapa jauh perbaikan bisa dicapai melalui cara kebetulan? Sebetulnya tidak ada
penunjuk umum yang tersedia, meskipun beberapa ahli riset menyarankan bahwa akurasi
klasifikasi tercapai dengan analisis diskriminan, kalau bisa 25% lebih besar daripada dengan cara
kebetulan.
Kebanyakan program analisis diskriminan juga mengestimasi suatu metric klasifikasi
berdasarkan pada analysis sample, yang pada umumnya memberikan hasil klasifikasi yang lebih
apabila dibandingkan dengan metric klasifikasi yang didasarkan pada holdout sample.
Tabel 4, mengenai contoh vacation resort, juga menunjukkan hasil klasifikasi
berdasarkan pada analysis sample. The hit ratio yaitu persentase objek/kasus yang secara tepat
diklasifikasi sebesar (12 + 15)/30 = 0,90 atau 90%. Seseorang mungkin curiga, bahwa hit ratio
digelembungkan (to be inflated), karena data yang dipergunakan untuk keperluan estimasi, juga
dipergunakan untuk validasi membentuk analisis klasifikasi pada set data hold out yang bebas
satu sama lain (independent), menghasilkan metrik klasifikasi dengan sedikit lebih rendah hit
ratio-nya = (4 + 6)/12 = 0,50 atau 50%. Jadi perbaikan yang dicapai melebihi 25% dibandingkan
dengan cara kebetulan (83,3% - 50% = 33,3% > 25%), sehingga validasi analisis diskriminan,
dianggap memuaskan.

2. Lebih dari dua kelompok (Multiple Discriminant Analysis)


Data yang disajikan pada Tabel 2 bisa juga dipergunakan untuk membuat ilustrasi analisis
diskriminan tiga kelompok. Kolom terakhir dari Tabel 2 rumah tangga dikelompokkan menjadi 3
kelompok, yaitu didasarkan pada jumlah pengeluaran pada liburan keluarga (family vacation)
(tinggi, menengah, rendah). Setiap kategori (kelompok) terdiri dari 10 rumah tangga. Pertanyaan
yang menarik untuk dijawab ialah apakah rumah tangga yang pengeluarannya untuk liburan:
tinggi, menengah, dan rendah bisa dibedakan (differentiated) dinyatakan dalam pendapatan
(income), sikap terhadap travel (travel), pentingnya liburan bagi keluarga (vacation), jumlah
anggota rumah tangga (house holdsize) dan umur kepala rumah tangga (age).
Mengestimasi Koefisien Fungsi Diskriminan
Tabel menunjukkan hasil mengestimasi analisis diskriminan 3 kelompok (kategori).
Pengkajian rata-rata kelompok (group means) menunjukkan bahwa pendapatan tampak
memisahkan kelompok lebih menonjol daripada variabel lainnya. Ada beberapa pemisahan pada
travel dan vacation.
Kelompok 1 dan 2 sangat dekat dinyatakan dalam banyaknya anggota rumah tangga dan
umur. Umur mempunyai standar deviasi yang besar relatif terhadap pemisahan (separation)
antara kelompok. The pooled within-groups correlation metric menunjukkan beberapa korelasi
antara vacation dan household size dengan income. Umur (age) mempunyai korelasi negatif
dengan travel. Korelasi-korelasi ini berbeda pada posisi yang rendah, menunjukkan bahwa
meskipun terjadi multicollinearity, akan tetapi tidak begitu serius masalahnya. Signifikansi yang
terkait pada rasio F, menunjukkan bahwa kalau prediktor (variabel bebas) dilihat secara individu,
hanya income and travel yang signifikan di dalam membedakan antara dua kelompok.
Di dalam analisis diskriminan berganda, kalau ada kelompok sebanyak G, aka nada G 1
fungsi diskriminan yang bisa diperkirakan, kalau banyaknya prediktor lebih besar dari G. Pada
umumnya, dengan G kelompok dan k prediktor, ada kemungkinan untuk mengestimasi fungsi
diskriminan sebanyak min [(G 1), k]. Fungsi pertama, mempunyai rasio sum of squares
tertinggi/besar antara kelompok dengan dalam kelompok. Fungsi kedua, dan seterusnya. Namun
demikian tidak semua fungsi signifikan secara statistik.
Oleh karena ada 3 kelompok, secara maksimum ada dua fungsi yang diekstraksi. Eigenvalue
yang berasosiasi dengan fungsi pertama 3,8190 dan fungsi ini sudah menyambung varian sebesar
93,93% dari varian yang dijelaskan. Sebab fungsi pertama superior. Sedangkan fungsi kedua,
eigenvalue-nya hanya 0,2460 besarnya sumbangan hanya 6,07%.

Menentukan Signifikansi Fungsi Diskriminan

Menguji hipotesis nol bahwa dua kelompok mempunyai centroid yang sama besarnya,
kedua fungsi harus dianggap bersama-sama atau simultan. Sebetulnya dimungkinkan untuk
menguji rata-rata fungsi secara berurutan, akan tetapi pertama-tama harus diuji secara simultan.
Kemudian satu fungsi dikeluarkan/dipisahkan setiap saat dan rata-rata dari sisa fungsi, diuji pada
setiap langkah.
Pada Tabel angka 0 (nol) di bawah judul After Function menunjukkan bahwa taka da
fungsi yang sudah dipisahkan/disingkirkan. Nilai Wilks sebesar 0,1644. Ini diubah menjadi kaiskwer (chi-squre) sebesar 44,831 dengan d.f = 10 (sepuluh), yang signifikan pada = 0,05 (5%).
Jadi, kedua fungsi secara bersama-sama mendiskriminasi secara signifikan antara tiga kelompok.
Namun begitu, apabila fungsi 1, kita singkirkan, nilai Wilks (lambda) yang berasosiasi dengan
fungsi kedua sebesar 0,8020 yang tidak signifikan pada nilai = 5% = 0,05. Dengan demikian
fungsi yang kedua tidak memberikan hasil yang signifikan pada perbedaan kelompok.
Menginterpretasi Hasil
Interpretasi hasil dibantu dengan mengkaji koefisien fungsi diskriminan yang dibakukan,
korelasi struktur, dan certain plots. Koefisien yang dibakukan menunjukkan suatu koefisien yang
besar untuk income pada fungsi 1, sedangkan fungsi 2 mempunyai koefisien relatif besar untuk
travel, vacation and age. Kesimpulan yang sama diperoleh dengan mengkaji metrik struktur.
Untuk membantu menginterpretasi fungsi, variabel dengan koefisien besar untuk suatu fungsi
tertentu, dikelompokkan bersama. Pengelompokkan itu ditandai dengan tanda * (asterisks). Jadi
income dan household size mempunyai tanda asterist, untuk fungsi 1, sebab variabel-variabel ini
mempunyai koefisien yang lebih besar dan untuk fungsi 1 (satu) daripada fungsi 2 (dua). Kedua
variabel ini terkait dengan fungsi 1 (0,85566; 0,19319). Di sisi lain travel, vacation and age
umumnya terkait dengan fungsi 2 (dua) (0,58829; 0,45362; 0,34079).
Tabel 2 merupakan suatu scattergram plot dari semua kelompok pada fungsi 1 dan fungsi
2. Bisa dilihat bahwa kelompok 3 mempunyai nilai tertinggi pada fungsi 1, kelompok 1 nilanya
terendah. Oleh karena fungsi 1 utamanya berasosiasi dengan income dan household size, kita
akan mengharap tiga kelompok diurutkan pada dua variabel ini. Mereka dengan income yang
tinggi dan household size juga yang besar, kemungkinan besar akan mengeluarkan jumlah uang
yang besar untuk liburan (vacation). Sebaliknya, mereka dengan income yang rendah dan
household size yang kecil, akan mengeluarkan sejumlah uang yang kecil untuk liburan
(vacation). Interpretasi ini, lebih lanjut diperkuat dengan suatu pengkajian rata-rata kelompok
pada income dan household size.
Gambar lebih lanjut menunjukkan bahwa fungsi 2, cenderung memisah kelompok 1 (nilai
tinggi) dan kelompok 2 (nilai rendah). Fungsi ini utamanya berasosiasi dengan travel, vacation
and age. Dengan korelasi positif dari variabel-variabel ini dengan fungsi 2, di dalam metric
structure, kita mengharap untuk menemukan kelompok 1 akan lebih tinggi dari kelompok 2,
dinyatakan dalam travel, vacation, dan age.

Ini sungguh benar untuk travel dan vacation, seperti ditunjukkan oleh rata-rata kelompok
dari variabel-variabel ini. Kalau keluarga dalam kelompok 1 mempunyai sikap yang lebih
favourable terhadap travel dan mengganggap lebih penting liburan keluarga (family vacation)
daripada kelompok 2, mengapa mereka mengeluarkan uang lebih sedikit? Mungkin, mereka
memang ingin mengeluarkan lebih banyak uang untuk liburan (vacation) akan tetapi tidak bisa
(mampu) melakukan, sebab income mereka rendah.
Interpretasi yang mirip juga bisa diperoleh melalui pengkajian suatu territorial map,
seperti ditunjukkan pada gambar. Di dalam territorial map, setiap centroid kelompok ditunjukkan
/ ditandai dengan tanda asterisk. Batas kelompok ditunjukkan dengan angka yang sesuai dengan
nomor kelompok. Centroid kelompok 2, juga dibatasi dengan angka 2 begitu selanjutnya,
centroid kelompok 3, dengan angka 3.
Penilaian Validitas Analisis Diskriminan
Hasil klasifikasi didasarkan pada analisis sampel, menunjukkan bahwa ( 9 + 9 + 8)/30 =
86,67 persen dari objek atau kasus yang klasifikasinya (pengelompokkannya) benar. Apabila
analisis klasifikasi dilakukan pada independent holdout sample untuk mengukur hit ratio lebih
rendah yaitu hanya 83,3%, artinya objek atau kasus diklasifikasi secara benar 83,3% lebih kecil
dari 86,67%. Oleh karena masing-masing kelompok, besarnya sampel sama yaitu 10 objek, maka
secara kebetulan (by chance), besarnya hit ratio = 1/3 = 0,333 atau 33,3% setelah dikalikan
100%. Perbaikan sebesar hit ratio 83,3% = 50% menunjukkan bahwa validitas bisa dinilai cukup
baik.
Analisis Diskriminan Bertahap (Stepwise Discriminant Analysis)
Analisis diskriminan bertahap bisa dianalogkan seperti regresi berganda bertahap (stepwise), di
mana variabel bebas atau prediktor dimasukkan secara beruntun (sequentially) berdasarkan pada
kemampuannya untuk mendiskriminasi antara kelompok. Suatu rasio F dihitung untuk setiap
prediktor dengan jalan melakukan suatu analisis varian univariat, di mana kelompok
diperlakukan sebagai variabel kategori (non-metrik) dan prediktor sebagai variabel kriterion atau
variabel depeden. Suatu prediktor dengan nilai rasio F yang tinggi, yang pertama-tama terpilih
untuk dimasukkan dalam fungsi diskriminan, kalau prediktor tersebut memenuhi kriteria
signifikansi dan toleransi tertentu. Prediktor kedua ditambahkan berdasarkan pada the highest
adjusted or partial F ratio, dengan memperhitungkan prediktor yang telah dipilih sebelumnya,
dan seterusnya.
Setiap prediktor yang telah terpilih diuji untuk retensi berdasarkan pada hubungannya dengan
prediktor lainnya yang telah dipilih. Proses pemilihan dan retensi dilanjutkan sampai semua
prediktor memenuhi kriteria signifikansi untuk dimasukkan dan dipertahankan dalam fungsi
diskriminan. Beberapa statistic dihitung pada setiap langkah. Sebagai tambahan, pada
kesimpulan, suatu ringkasan mengenai prediktor yang masuk dan yang digeser dari fungsi

diskriminan, disediakan. Output atau hasil yang baku (standard) yang berkaitan dengan metode
langsung juga tersedia dari prosedur tahap demi tahap (stepwise procedure).
Pemilihan prosedur tahap demi tahap didasarkan pada kriteria optimisasi yang dipergunakan.
Prosedur Mahalanobis, didasarkan pada maksimisasi suatu ukuran umum mengenai jarak dua
kelompok yang paling dekat atau a generalized measure of the distance between the two closest
groups. Prosedur ini memungkinkan peneliti pemasaran memanfaatkan/menggunakan secara
maksimal data/informasi yang tersedia.
Metode/prosedur Mahalanobis dipergunakan untuk melakukan analisis diskriminan bertahap
(stepwise) dua kelompok, pada data yang didasarkan pada visit variable.
Prediktor pertama yang dipilih ialah income, diikuti dengan household size, kemudian vacation.
Urutan untuk mana variabel dipilih juga menunjukkan pentingnya variabel-variabel tersebut di
dalam mendiskriminasi antar-kelompok. Ini lebih lanjut dibenarkan (corroborated) dengan suatu
kajian koefisien fungsi diskriminan yang dibakukan dan koefisien korelasi struktur. Perhatikan
bahwa, penemuan analisis bertahap cocok dengan kesimpulan yang dilaporkan sebelumnya
dengan metode langsung (direct method)
III. KESIMPULAN
III.1.
Konsep Dasar dan Tujuan Analisis Diskriminan
III.2.
Hubungan Analisis Diskriminan dengan Anova dan Regresi Linier Berganda
III.3.
Model Analisis Diskriminan dan Statistik yang Relevan
III.4.
Proses Analisis Diskriminan

Anda mungkin juga menyukai