Anda di halaman 1dari 35

Kamarul Imam

rul2a@yahoo.com

ANALISIS DISKRIMINAN

1. Introduksi.
Analisis Regresi Logistik dan Analisis Diskriminan adalah teknik statistik yang sesuai untuk
variabel dependen yang bersifat katagorial (nominal atau nonmetrik) dengan variabel
independen bersifat metrik. Pada banyak kasus, variabel dependen terdiri dari dua kelompok
atau klasifikasi, contoh : laki­laki dan perempuan, tinggi dan rendah; bahkan seringkali juga
lebih dari dua kelompok, seperti : rendah, sedang dan tinggi. Analisis Diskriminan dapat
diaplikasi kepada dua kelompok atau lebih. Jika hanya ada dua kelompok variabel dependen,
maka analisis disebut sebagai Two Group Discriminant Analysis, sedang untuk tiga kelompok
atau lebih, analisis disebut Multiple Discriminant Analysis (MDA). Analisis Regresi Logistik
atau disebut sebagai Analisis Logit terbatas hanya pada dua kelompok variabel dependen,
walaupun dengan formulasi alternatif analisis ini bisa diaplikasi kepada lebih dari dua
kelompok variabel dependen.
Analisis Diskriminan melibatkan penurunan sebuah variat, merupakan kombinasi linier terbaik
dari dua variabel independen atau lebih yang akan mendiskriminasi antara kelompok­
kelompok yang secara apriori didefinisikan sejak awal. Diskriminasi dapat diperoleh melalui
mengatur bobot variat untuk setiap variabel untuik memaksimumkan varians antar kelompok
relatif terhadap varians di dalam kelompok. Kombinasi linier tersebut disebut sebagai fungsi
diskiriminan, yang diderivasi dari sebuah persamaan dalam bentuk :
Zjk = a + W1 X1k + W2 X2k + . . . . + Wn Xnk
Di mana,
Zjk = skor diskriminan dari fungsi diskriminan­j untuk obyek­k,
a = intersep,
Wi = bobot diskriminan untuk variabel independen­i,
Xik = variabel independen­i untuk obyek­k.
Analisis Diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis yang
menyatakan bahwa rata­rata kelompok dari sekumpulan variabel independen untuk dua
kelompok atau lebih, setara. Untuk menyatakan hal itu, Analisis Diskriminan mengkalikan
nilai setiap variabel independen dengan bobotnya masing­masing dan menjumlahkannya
bersama­sama. Hasilnya adalah sebuah skor Z diskriminan tunggal yang bersifat komposit
untuk setiap individual dalam analisis. Melalui perata­rataan terhadap skor diskriminan untuk
seluruh individual pada suatu kelompok tertentu, akan dihasilkan rata­rata kelompok, atau
disebut sebagai group centroids. Centroids ini mengindikasikan sebagian besar lokasi tipikal
dari setiap individual yang ada pada kelompok tertentu, dan sebuah perbandingan terhadap
centroids kelompok akan menunjukkan seberapa jauh kelompok­kelompok itu terpisah.
Uji signifikansi statistikal terhadap fungsi diskriminan adalah ukuran yang digeneralisasi dari
jarak antara centroids kelompok. Ini ditentukan dari perbandingan distribusi skor diskriminan
untuk kelompok­kelompok. Jika overlaps distribusi yang dihasilkan itu kecil, maka fungsi
diskriminan memisahkan kelompok­kelompok itu dengan baik. Jika overlaps distribusi itu
besar, maka fungsi diskriminan yang dihasilkan adalah fungsi yang tidak dapat berperan
sebagai diskriminator dengan baik.
Secara grafis, konsep hasil uji signifikansi statistik kepada fungsi diskriminan dapat
digambarkan seperti pada gambar berikut :

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 1


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

A B

A B

Gambar yang di atas menunjukkan bahwa fungsi diskriminan dapat mendiskriminasi


kelompok A dan B dengan baik. Daerah berarsir adalah adalah daerah kesalahan klasifikasi,
yaitu individual dari kelompok A diklasifikasi sebagai anggota kelompok B. Gambar yang di
bawah menunjukkan bahwa fungsi diskriminan kurang dapat mendiskriminasi kelompok A
dan B dengan baik.
Analisis Diskriminan Multiple memiliki karakter yang unik di antara analisis­analisis hubungan,
yaitu : jika ada lebih dari dua kelompok sebagai variabel dependen, analisis diskriminan akan
menghitung lebih dari satu fungsi diskriminan (NG – 1), di mana NG adalah banyaknya
kelompok. Setiap fungsi menghitung skor Z pada setiap kelompok yang diperbandingkan.
Analisis Logit adalah bentuk khusus dari analisis regresi yang difromulasikan untuk
memprediksi dan menjelaskan sebuah variabel dependen dengan sifat katagori (binary).
Perbedaan antar Analisis Logit dengan Analisis Diskriminan adalah terutama pada asumsi
yang mendasari. Asumsi pada Analisis Diskriminan : multivariat normal dan kesetaraan
matriks varians­kovarians antar kelompok, adalah asumsi yang sulit dipenuhi pada banyak
situasi. Untuk variabel dependen yang terdiri atas dua kelompok katagorial, Analisis Logit
lebih direkomendasi daripada Analisis Diskriminan.

2. Contoh Hipotetis Analisis Diskriminan.


Analisis Diskriminan diaplikasi dengan tujuan pemahaman kepada anggota kelompok, apakah
kelompok­kelompok itu berupa individual (pelanggan dan bukan pelanggan), perusahaan
(profitable dan unprofitable), produk (berhasil dan tidak berhasil); yang bisa dievaluasi
melalui serangkaian variabel independen.
Contoh­1 : Analisis Diskriminan Dua Kelompok.
HATCO bermaksud mengetahui apakah sebuah produk baru – food mixer, akan berhasil
dipasarkan secara komersial. Untuk itu HATCO melakukan survey kepada calon
pelanggannya. HATCO mengklasifikasi dua kelompok pelanggan, yaitu pelanggan yang akan
membeli produk baru tersebut dan pelanggan yang tidak akan membeli. HATCO telah
menentukan tiga variabel yang diperkirakan menjadi pertimbangan pelanggan dalam
memutuskan membeli atau tidak, yaitu : daya tahan (durability), kualitas hasil (performance)

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 2


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

dan tampilan (style). Kuesioner yang disebar kepada pelanggan berisi pertanyaan­
pertanyaan yang menyangkut kepada ketiga variabel ini, dengan skor jawaban 1 sampai
dengan 10 (1 = sangat buruk, 10 = istimewa). Hasil survey kepada pelanggan dari dua
kelompok adalah :
Tabel 1. Skor Evaluasi Pelanggan Terhadap Produk Baru.
Kelompok Berdasar Intensi Evaluasi Terhadap Produk Baru
Pembelian X1 (durability) X2 (performance) X3 (style)
Kelompok­1 : Akan Membeli
Pelanggan 1 8 9 6
Pelanggan 2 6 7 5
Pelanggan 3 10 6 3
Pelanggan 4 9 4 4
Pelanggan 5 4 8 2
Rata­rata kelompok 7.4 6.8 4.0

Kelompok­2 : Tidak Membeli


Pelanggan 6 5 4 7
Pelanggan 7 3 7 2
Pelanggan 8 4 5 5
Pelanggan 9 2 4 3
Pelanggan 10 2 2 2
Rata­rata kelompok 3.2 4.4 3.8
Selisih Rata­rata 4.2 2.4 0.2
Dengan sepuluh pelanggan yang diamati pada tiga variabel pertimbangan, dapat dibuat
grafik untuk melihat apa yang dihasilkan Analisis Diskriminan. (Pelanggan yang akan
membeli ditandai lingkaran, yang tidak membeli ditandai dengan kotak).

10 8

9 7 5 6 2 1 4 3
X1
1 2 3 4 5 6 7 8 9 10

9
6 7
10 4 8 3 2 5 1
X2
1 2 3 4 5 6 7 8 9 10

10
7 9 8
5 3 4 2 1 6
X3
1 2 3 4 5 6 7 8 9 10

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 3


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Pada grafik X1 (dengan selisih rata­rata kelompok terbesar), tampak bahwa variabel ini
hampir dapat mendiskriminasi dengan sempurna. Dengan titik diskriminasi (cutting point) =
5.5; tampak hanya satu pelanggan yang akan membeli terklasifikasi sebagai pelanggan yang
tidak membeli, yaitu pelanggan no. 5. Kesalahan klasifikasi = 1/10 = 10%. Makin besar
selisih rata­rata kelompok, makin memperkecil daerah overlaps.
Pada grafik X2, kesalahan klasifikasi terjadi pada pelanggan no. 4 dan no. 7. Pelanggan no. 5
terklasifikasi dengan benar, walaupun pada X1 pelanggan no. 5 ini terklasifikasi dengan tidak
benar, dan sebagian besar pelanggan terklasifikasi dengan benar seperti pada variabel X1.
Dapat disimpulkan bahwa X1 dan X2 secara bersama­sama dapat digunakan sebagai
kombinasi linier dalam fungsi diskriminan.
Pada grafik X3, kesalahan klasifikasi makin tinggi. Maka dengan mengabaikan X3, fungsi
diskriminan (kombinasi X1 dan X2) lebih mampu mendiskriminasi kedua kelompok.
Perbandingan percentage correctly classified (cc) terhadap tiga alternatif fungsi diskriminan
dapat dilihat pada tabel berikut :
Tabel 2. Perbandingan CC Fungsi Diskriminan.
Hasil Perhitungan Z­score
Kelompok Fungsi 1: Fungsi 2 : Fungsi 3 :
Z = X1 Z = X1 + X2 Z = ­4.53 + .476 X1 + .359 X2
Kelompok­1 : Akan Membeli
Pelanggan 1 8 17 2.51
Pelanggan 1 6 13 0.84
Pelanggan 1 10 16 2.38
Pelanggan 1 9 13 1.19
Pelanggan 1 4 12 0.25

Kelompok­2 : Tidak Membeli


Pelanggan 1 5 9 ­0.71
Pelanggan 1 3 10 ­0.59
Pelanggan 1 4 9 ­0.83
Pelanggan 1 2 6 ­2.14
Pelanggan 1 2 4 ­2.86
Cutting Score 5.5 11 0.0
CC pada masing­masing fungsi diskriminan dapat dihitung sebagai berikut :
Prediksi Prediksi Prediksi
Kelompok Kelompok Kelompok
Kelompok Kelompok Kelompok
1 2 1 2 1 2
Aktual Aktual Aktual
1 4 1 1 5 0 1 5 0
2 0 5 2 0 5 2 0 5
CC fungsi 1 = 90% CC fungsi 2 = 100% CC fungsi 3 = 100%
Keterangan :
Fungsi 3 adalah fungsi eksplisit yang dihasilkan dari data input.
Representasi geometrik dapat dijelaskan oleh gambar berikut :

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 4


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

V1

A
Zcutoff B

A
B

V2

Gambar di atas menjelaskan dua kelompok yang berbeda, dengan V1 dan V2 sebagai ukuran
setiap individual anggota masing­masing kelompok. Garis cutoff adalah garis yang membagi
kedua kelompok berbeda. Daerah intersection merupakan daerah overlaps yang menyatakan
kesalahan klasifikasi.
Keofisien diskriminan dihitung dengan prinsip maksimasi varians antar kelompok dan
minimasi varians di dalam kelompok. Jika varians antar kelompok relatif lebih besar
dibanding varians di dalam kelompok, maka fungsi diskriminan dapat mengklasifikasi
kelompok dengan lebih baik.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 5


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Contoh­2: Analisis Diskriminan Tiga Kelompok.


HATCO melakukan survey terhadap kemungkinan perpindahan pelanggan dari para pesaing.
HATCO mendefinisikan ada tiga kelompok pelanggan, yaitu : (1) melakukan perpindahan, (2)
tidak memutuskan apa­apa dan (3) tidak melakukan perpindahan. Penelitian kecil dialkukan
HATCO dengan melibatkan 15 pelanggan sebagai responden, di mana masing­masing
kelompok terdiri atas lima orang. Indikator penyebab perpindahan pelanggan yang
dipertimbangkan adalah : harga kompetitif (X1) dan kualitas pelayanan (X2).
Kuesioner yang disebar kepada pelanggan berisi pertanyaan­pertanyaan yang menyangkut
kepada kedua variabel ini, dengan skor jawaban 1 sampai dengan 10 (1 = sangat buruk, 10
= istimewa). Hasil survey kepada pelanggan dari tiga kelompok adalah :
Tabel 3. Skor Evaluasi Pelanggan Kemungkinan Perpindahan Kepada Pesaing.
Kelompok Berdasar Intensi Evaluasi Terhadap Suplier Sekarang
Perpindahan X1 (price) X2 (service)
Kelompok­1 : Akan Pindah
Pelanggan 1 2 2
Pelanggan 2 1 2
Pelanggan 3 3 2
Pelanggan 4 2 1
Pelanggan 5 2 3
Rata­rata kelompok 2.0 2.0

Kelompok­2 : Tidak Memutuskan


Pelanggan 6 4 2
Pelanggan 7 4 3
Pelanggan 8 5 1
Pelanggan 9 5 2
Pelanggan 10 5 3
Rata­rata kelompok 4.6 2.2

Kelompok­3 : Tidak Pindah


Pelanggan 11 2 6
Pelanggan 12 3 6
Pelanggan 13 4 6
Pelanggan 14 5 6
Pelanggan 15 5 7
Rata­rata kelompok 3.8 6.2
Dengan tiga kelompok yang akan diklasifikasi, Analisis Diskriminan menghasilkan dua fungsi
diskriminan, di mana setiap fungsi merepresentasikan pembedaan antar kelompok. Untuk
variabel X1, selisih rata­rata kelompok­1 cukup besar terhadap rata­rata kelompok­2 atau
kelompok­3 (2.0 terhadap 4.6 atau 3.8). X1 bisa mendiskriminasi antara kelompok­1 dengan
kelompok­2 atau dengan kelompok­3; tetapi kurang efektif untuk diskriminasi antara
kelompok­2 dan kelompok­3. Untuk variabel X2, selisih rata­rata pada kelompok­1 dan
kelompok­2 tidak cukup besar (2.0 dengan 2.2); tetapi pada kelompok­3 selisih rata­ratanya
cukup besar dengan kelompok­1 dan kelompok­2 (6.2 dengan 2.0 atau 2.2). Variabel X1
membedakan kelompok­1 terhadap kelompok­2 dan kelompok­3 dan variabel X2
membedakan kelompok­3 terhadap kelompok­1 dan kelompok­2. X1 dan X2 memiliki dimensi
diskriminasi antar kelompok yang berbeda.
Secara grafis dapat dijelaskan kemampuan diskriminasi masing­masing variabel kepada
kelompok­1, kelompok­2 dan kelompok­3.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 6


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

15

11 14

5 13 10

4 12 7 9

2 1 3 6 8

X1

1 2 3 4 5 6 7 8 9 10

6 14

3 10 13

8 2 7 12

4 1 5 11 15

X2

1 2 3 4 5 6 7 8 9 10
Dari grafik tersebut di atas, tampak bahwa tidak ada variabel yang benar­benar dapat
mendiskriminasi ketiga kelompok itu. Namun jika bisa dibuat dua buah fungsi diskriminan
sederhana, hasilnya akan menjadi lebih jelas. Seandainya kedua fungsi itu untuk masing­
masing variabel bebasnya diberi bobot 1 dan 0, hasilnya adalah :
Fungsi 1 : Z = 1 X1 + 0 X2
Fungsi 2 : Z = 0 X1 + 1 X2
Dari kedua fungsi hipotetis itu selanjutnya dapat dihitung skor diskriminan untuk setiap
anggota kelompok.
Tabel 4. Skor Diskriminan Individual Pada Setiap Kelompok Dengan Fungsi 1.
Pelanggan Z score Pelanggan Z score Pelanggan Z score
1 2 6 4 11 2
2 1 7 4 12 3
3 3 8 5 13 4
4 2 9 5 14 5
5 2 10 5 15 5
Tabel 5. Skor Diskriminan Individual Pada Setiap Kelompok Dengan Fungsi 2.
Pelanggan Z score Pelanggan Z score Pelanggan Z score
1 2 6 2 11 6
2 2 7 3 12 6
3 2 8 1 13 6
4 1 9 2 14 6
5 3 10 3 15 7

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 7


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Secara grafis, klasifikasi kelompok berdasar skor diskriminan masing­masing individual dapat
digambarkan sebagai berikut :

Fungsi 2

7 15

6 11 12 13 14

3 5 7 10

2 1 3 6 9
2

1 4 8

Fungsi 1

1 2 3 4 5 6

Tampak dari grafik ini, bahwa skor diskriminan setiap individual untuk kelompok­1 dan
kelompok­2 pada fungsi­2 tidak pernah melampaui 4.5. Skor diskriminan kelompok­1 tidak
pernah melampaui 3.5 pada fungsi­1. Skor diskriminan individual pada fungsi­3 di atas 4.5
pada fungsi­2. Pembobotan sederhana kepada variabel­variabel bebas pada fungsi­1 dan
fungsi­2 seperti di atas telah cukup dapat mengklasifikasi ketiga kelompok dengan baik.

3. Kerangka Kerja Untuk Analisis Diskriminan.


Langkah­langkah operasional dalam Analisis Diskriminan terdiri atas enam tahapan berurutan
yaitu :
Tahap­1 : Problem Penelitian.
Tahap­2 : Isu Desain Penelitian.
Tahap­3 : Asumsi.
Tahap­4 : Estimasi Fungsi Diskriminan dan Menghitung Akurasi Prediksi Fungsi.
Tahap­5 : Interpretasi Fungsi Diskriminan.
Tahap­6 : Validasi Hasil Diskriminan.
Flowchart keenam langkah dapat digambarkan sebagai berikut :

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 8


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Tahap 1
Problema Penelitian
Pilih tujuan :
1. Evaluasi selisih kelompok dengan basis multivariat.
2. Klasifikasi pengamatan ke dalam kelompok.
3. Identifikasi dimensi diskriminan antar kelompok.

Tahap 2
Isu Desain Penelitian
1. Seleksi variabel independen.
2. Pertimbangkan banyaknya sampel.
3. Lakukan analisis dan tentukan sampel.

Tahap 3
Asumsi
1. Normalitas variabel independen.
2. Linieritas hubungan.
3. Multikolinieritas di antara variabel independen.
4. Matriks dispersi yang setara.

Tahap 4
Estimasi Fungsi Diskriminan
1. Estimasi simultan atau stepwise.
2. Signifikansi fungsi diskriminan.
Pengukuran akurasi kemampuan prediksi fungsi dengan
matriks klasifikasi
1. Hitung cutting score optimal.
2. Tentukan kriteria untuk menghasilkan hit ratio.
3. Signifikansi statistik dari akurasi prediksi.

Tahap 5
Satu Interpretasi Fungsi Diskriminan Dua
Berapa banyak fungsi akan diinterpretasi ? atau lebih

Evaluasi Fungsi Tunggal Evaluasi Fungsi Terpisah


1. Bobot diskriminan 1. Bobot diskriminan.
2. Discriminant loadings 2. Discriminant loadings.
3. Nilai F parsial. 3. Nilai F parsial.
Evaluasi Fungsi Dikombinasi
1. Fungsi yang dirotasi.
2. Potency Index.
3. Grafik centroid kelompok.
4. Grafik loadings.
Tahap 6
Validasi Hasil Diskriminan
1. Split sampel atau validasi silang.
2. Memberi profil selisih kelompok.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 9


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

a. Tahap­1. Tujuan Analisis Diskriminan.


Tujuan Analisis Diskriminan antara lain adalah :
­ menentukan apakah rata­rata skor yang dihitung dari sekumpulan variabel dari
dua kelompok yang terdefinisi atau lebih, signifikan berbeda secara statistik.
­ menentukan variabel manakah yang dominan dalam membedakan kedua
kelompok atau lebih.
­ membangun prosedur untuk mengklasifikasi obyek (individual, perusahaan,
produk dan lainnya) ke dalam suatu kelompok berdasar skor dari sekumpulan
variabel independen.
­ mengatur jumlah dan komposisi dimensi diskriminasi antara kelompok yang
terbentuk dari sekumpulan variabel independen.
b. Tahap 2. Desain Penelitian Untuk Analisis Diskriminan.
b.1 Seleksi variabel dependen dan variabel independen.
Untuk mengaplikasi Analisis Diskriminan, terlebih dahulu harus menentukan
manakah variabel independen dan variabel dependen. Perlu diingat, bahwa
variabel dependen bersifat katagorial, sedang variabel independen bersifat
metriks. Peneliti terlebih dahulu harus memfokuskan diri kepada variabel
dependen. Variabel dependen bisa terdiri atas dua kelompok atau lebih, di mana
masing­masing kelompok bersifat mutually exclusive dan exhaustive., artinya
setiap anggota kelompok hanya bisa dimasukkan ke dalam suatu kelompok
tertentu. Analisis Diskriminan masih sesuai diaplikasikan pada variabel dependen
yang bersifat ordinal bahkan interval1.
Beberapa katagori kelompok bisa dikembangkan, biasanya dua, tiga atau empat
kelompok. Tetapi lebih dari itu bisa dikembangkan jika diperlukan. Tetapi, dari
kelompok­kelompok yang dibangun bisa juga disederhanakan menjadi dua
kelompok ekstrim, sehingga hanya dibutuhkan Analisis Diskriminan Dua
Kelompok. Prosedur semacam ini disebut sebagai polar extreme approach, di
mana hanya melibatkan dua kelompok ekstrim saja dan mengabaikan kelompok­
kelompok moderat lainnya.
Variabel independen biasanya ditentukan melalui dua cara, yaitu : (1) dari
penelitian sebelumnya atau dari teori­teori dasarnya, dan (2) dari intuisi dan
pengetahuan si peneliti yang logik.
b.2 Ukuran sampel.
Analisis Diskriminan agak sensitif terhadap ratio banyaknya sampel dengan
banyaknya variabel bebas. Banyak penelitian menyarankan 20 pengamatan
untuk setiap variabel bebas. Tetapi sangat direkomendasikan bahwa jumlah
sampel sebaiknya 5 kali dari banyaknya variabel bebas2. Perlu pula
dipertimbangkan banyaknya sampel pada setiap kelompok yang diteliti. Pada
kondisi minimum, jumlah pengamatan pada kelompok terkecil harus lebih
banyak daripada banyaknya variabel bebas. Sebagai petunjuk praktis, setiap
kelompok hendaknya terdiri atas 20 buah sampel. Namun, walaupun telah
demikian masih perlu juga dipertimbangkan ukuran relatif dari kelompok,
upayakan banyaknya sampel pada setiap kelompok tidak terlalu jauh.

1
Joseph F. Hair et al, Multivariate Data Analysis, 1988:257.
2
Op­cit, 258.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 10


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

b.3 Pemecahan sampel.


Seringkali sampel dibagi menjadi dua sub­sampel, yaitu : (1) sub­sampel yang
digunakan untuk mengestimasi fungsi diskriminan, atau disebut sebagai analysis
sample yang dianalisis dan (2) sub­sampel yang digunakan untuk keperluan
validasi atau disebut sebagai holdout sample. Metode untuk memvalidasi fungsi
adalah pendekatan spilt­sample atau cross­validation. Ukuran kedua sub­sampel
harus cukup untuk menghasilkan kesimpulan yang jelas. Tidak ada metode yang
pasti untuk memisahkan sampel menjadi dua sub­sampel, namun ada
pendekatan yang populer yaitu memisahkan menjadi dua bagian yang sama.
Pemisahan sampel menjadi dua sub­sampel tetap didasari oleh prosedur
proportionately stratified sampling. Jika kelompok­kelompok katagori untuk
Analisis Diskriminan setara direpresentasi oleh total sampel, maka dipilih
sejumlah sampel individual yang setara. Jika kelompok­kelompok katagori tidak
setara direpresentasi oleh total sampel, maka banyaknya sub­sampel untuk
holdout sample harus ditentukan secara proporsional kepada total sampel.
Contoh, jika total sampel terdiri dari 50 orang laki­laki dan 50 orang wanita,
maka sub­sampel sebagai holdout sample (sampel cadangan) adalah 25 orang
laki­laki dan 25 orang wanita. Jika total sampel terdiri dari 70 orang laki­laki dan
30 orang wanita, maka holdout sample = 35 orang laki­laki dan 15 orang
wanita.
Jika jumlah total sampel terlalu sedikit, maka pemisahan menjadi sub­sampel
tidak perlu dilakukan. Validasi fungsi bisa dilakukan dengan sampel yang ada.
c. Tahap 3. Asumsi pada Analisis Diskriminan.
Beberapa asumsi yang diberlakukan pada Analisis Diskriminan adalah :
c.1 Variabel independen harus multivariat normal, dengan penyebaran yang setara
(homogenitas) walaupun tidak diketahui dan matriks atau struktur kovarian
untuk kelompok­kelompok didefinisikan oleh variabel dependen. Jika asumsi ini
tidak terpenuhi, maka timbul persoalan dalam estimasi koefisien fungsi. Maka
sebaiknya, kalau memungkinkan dialihkan saja persaoalannya sebagai Analisis
Logit.
c.2 Tidak teridentifikasi multikolinieritas dan singularitas di antara variabel bebas.
c.3 Outliers. Jika ada data yang ekstrim, upayakan dieliminasi. Lakukan terlebih
dahulu uji kepada setiap kelompok secara terpisah baik secara univariat maupun
multivariat.
c.4 Hubungan antara variabel bebas dengan variabel tak bebas bersifat linier.
d. Tahap 4. Estimasi Fungsi Diskriminan dan Uji Kualitas Model.
Untuk memperoleh fungsi diskriminan, peneliti harus menentukan metode estimasi
fungsi, kemudian menentukan banyaknya fungsi yang dipertahankan. Untuk
mengukur tingkat kualitas fungsi dapat dilakukan melalui beberapa prosedur, yaitu :
(1) menghitung Z­skor fungsi diskriminan yang dihitung untuk setiap sampel, (2)
hitung rata­rata Z­skor pada setiap kelompok, (3) bandingkan rata­rata Z­skor
kelompok untuk memperoleh sebuah nilai yang dapat mendiskriminasi kelompok.
Selanjutnya, lakukan casewise diagnostics untuk mengidentifikasi akurasi klasifikasi
setiap pengamatan dan dampak relatifnya terhadap estimasi model secara
keseluruhan.
d.1 Metode perhitungan.
Ada dua metode perhitungan untuk estimasi koefisien fungsi diskriminan, yaitu :
(1) estimasi simultan dan (2) estimasi stepwise. Metode estimasi simultan

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 11


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

dilakukan dengan melibatkan seluruh variabel bebas bersama­sama. Metode ini


tepat jika peneliti lebih menginginkan pengaruh seluruh variabel bebas secara
bersama­sama karena alasan teoritis.
Metode estimasi stepwise dilakukan dengan melibatkan variabel bebas satu per
satu ke dalam model, di mulai dari variabel bebas yang paling dapat
mendiskriminasi kelompok dengan baik, kemudian variabel bebas berikutnya
yang bila dikombinasikan dengan variabel bebas awal dapat meningkatkan
kemampuan diskriminasi model. Prosedur ini berlanjut sampai seluruh variabel
bebas telah dipertimbangkan kombinasinya dengan kriteria perbaikan
kemampuan diskriminasi model. Ada kemungkinan pada tahapan berikutnya,
sebuah variabel bebas yang telah dimasukkan ke dalam model pada tahapan
sebelumnya menjadi variabel yang harus didrop pada tahapan ini. Metode
stepwise tepat digunakan apabila peneliti lebih menginginkan variabel­variabel
bebas yang dapat mendiskriminasi kelompok secara signifikan maupun yang
tidak signifikan. Namun perlu dicatat, bahwa metode stepwise menjadi kurang
stabil dan kurang bisa generalisatif dengan penurunan ratio ukuran sampel
terhadap banyaknya variabel bebas, khususnya jika ukuran sampel di bawah 20
pengamatan pada setiap variabel bebas.
Contoh­3 : Estimasi Koefisien Diskriminan.
Tiga kelompok belajar murid yang menghadapi kesulitan, yaitu : (a) kelompok
MEMORY, kelompok yang menghadapi kesulitan dalam penggunaan memory, (b)
kelompok PERCEPTION, kelompok yang menghadapi kesulitan dalam persepsi
visual dan (c) kelompok COMMUNICATION, kelompok yang menghadapi
kesulitan dalam penggunaan bahasa. Empat variabel bebas yang dianggap dapat
mempengaruhi kelompok­kelompok ini adalah : (a) PERFORMANCE, skala IQ, (b)
INFO, informasi, (c) VERBEXP, ekspresi verbal dan (d) AGE, umur.
Data dengan ukuran sampel kecil adalah :
Tabel 6. Data Hipotetis.
Predictors
Group
PERF INFO VERBEXP AGE
87 5 31 6.4
MEMORY 97 7 36 8.3
112 9 42 7.2
102 16 45 7.0
PERCEPTION 85 10 38 7.6
76 9 32 6.2
120 12 30 8.4
COMMUNICATION 85 8 28 6.3
99 9 27 8.2
Estimasi koefisien fungsi diskriminan untuk masing­masing kelompok :
Zj = a + W1 Xj1 + W2 Xj2 + . . . . + Wk Xjk
Zj = skor klasifikasi untuk kelompok­j (j = 1, 2, ..., n),
Wi adalah koefisien fungsi diskriminan untuk variabel bebas­i (i = 1, 2, …, k),
Wi diestimasi dengan formula matriks :
Wi = Swg­1 Mj
Di mana Mj adalah matriks kolom rata­rata variabel bebas pada kelompok­j.
Sedang konstanta, a, diestimasi dengan formula matriks :

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 12


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

a = (­1/2) WiMj
Untuk data tersebut di atas, matriks Swg untuk kelompok­1 yang dihasilkan
adalah setiap elemen matriks Swg dibagi dengan dferror (dferror = 6) :
214.33 36.67 58.06 8.33
Swg1 = 36.67 7.56 12.28 1.06
58.06 12.28 25.00 1.62
8.33 1.06 1.62 0.92

Matriks inversi dari Swg1 :


0.04362 ­0.20195 0.00956 ­0.17990
Swg1­1 = ­0.20195 1.62970 ­0.37073 0.60623
0.00956 ­0.37073 0.20071 ­0.01299
­0.17990 0.60623 ­0.01299 2.05006

Kalikan matriks Swg1­1 dengan matriks kolom rata­rata variabel bebas pada
kelompok­1 untuk menghitung Wi fungsi diskriminan untuk kelompok­1 :
0.04362 ­0.20195 0.00956 ­0.17990 98.67
Wi = ­0.20195 1.62970 ­0.37073 0.60623 x 7.00
0.00956 ­0.37073 0.20071 ­0.01299 36.33
­0.17990 0.60623 ­0.01299 2.05006 7.30

= [ 1,92 ­17.56 5.55 0.99 ]


Konstanta dapat dihitung :
a = (­1/2) WiMj
98.67
= (­1/2) [1.92 17.56 5.55 0.99] 7.00 = ­137.83
36.33
7.30
Dengan cara yang sama akan dihasilkan koefisien fungsi diskriminan untuk
masing­masing kelompok sebagai berikut :
Tabel 7. Fungsi Diskriminan masing­masing Kelompok.
Kelompok­1 Kelompok­2 Kelompok­3
PERF 1.92420 0.58704 1.36552
INFO ­17.56221 ­8.69921 ­10.58700
VERBEXP 5.54585 4.11679 2.97278
AGE 0.98723 5.01749 2.91135
Konstanta ­137.83 ­71.28563 ­71.24188
Persamaan fundamental untuk menguji sekumpulan fungsi diskriminan, mirip
dengan MANOVA. Varians pada kelompok prediktor dapat dipisahkan menjadi
dua sumber, yaitu : varians dalam kelompok (within group atau Swg) dan antara
kelompok (between group atau Sbg). Melalui prosedur MANOVA, akan dibentuk
matriks cross­product :
Σ Σ (Xij – GM)2 = n Σ (Xj – GM)2 + Σ Σ (Xij – Xj)2
i j j i j

Jumlah kuadrat selisih data terhadap rata­rata total (GM) dipisahkan menjadi
dua kelompok varians :
Stotal = Sbg + Swg

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 13


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Matriks varians antar kelompok, Sbg :


314.89 ­71.56 ­180.00 14.49
Sbg = ­71.56 32.89 8.00 ­2.22
­180.00 8.00 168.00 ­10.40
14.49 ­2.22 ­10.40 0.74
Matriks varians dalam kelompok, Swg :
1286.00 220.00 348.33 50.00
Swg = 220.00 45.33 73.67 6.37
348.33 73.67 150.00 9.73
50.00 6.37 9.73 5.49
Determinan matriks ini adalah :
Swg = 4.70034789 x 1013

Sbg + Swg = 448.63489 x 1013


Wilk’s Lambda (Λ) untuk matriks ini :
Swg
Λ= = 0.10477
Sbg + Swg
Hitung nilai­F untuk menguji kemampuan prediksi fungsi diskriminan dengan formula
sebagai berikut :
1–y df2
Fdf1,df2 =
y df1
di mana,
y = Λ1/s
p2(dfeffect)2 ­ 4
s=√
p2 + (deffect)2 – 5
p = banyaknya variabel independen.
dfeffect = adalah derajat bebas perlakuan yang diuji = (k – 1)
df1 = p(dfeffect) dan
p – dfeffect + 1 p(dfeffect) ­ 2
df2 = s (dferror) – ­
2 2
di mana,
dferror = adalah derajat bebas yang berkaitan dengan error = (N ­ k)
Untuk contoh kasus di atas, nilai­nilai :
p = banyaknya variabel independen = 4
dfeffect = banyaknya kelompok dikurangi 1 = 3 ­ 1 = 2
dferror = banyaknya seluruh pengamatan dikurangi banyaknya kelompok = 9 ­ 3 = 6.
Dari nilai­nilai parameter ini dapat dihitung s :
(4)2 (2)2 ­ 4
s=√ =2
(4)2 + (2)2 – 5

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 14


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

y = Λ1/s = (0.010477)1/2 = 0.102357


df1 = p(dfeffect) = (4)(2) = 8
4–2+1 (4)(2) ­ 2
df2 = 2 6 ­ ­ =6
2 2

1 – 0.102357 6
F8,6 = = 6.58
0.102357 8
Kriteria nilai F pada Tabel F dengan df 8, 6 dan α = 0.05 adalah sama dengan 4.15.
Nilai F­hitung > F­kriteria, maka dapat disimpulkan bahwa ketiga kelompok belajar
dapat dibedakan dari kombinasi keempat variabel bebasnya. Ini merupakan uji
hipotesis secara keseluruhan mengenai hubungan kelompok dengan variabel­variabel
bebas.
Untuk menentukan tingkat korelasi antara fungsi dengan variabel­variabel bebas
dapat dihitung dari loading factor. Jika X1, X2 dan X3 memiliki korelasi yang tinggi
dengan fungsi, kecuali X4 dan X5 tidak; maka peneliti mencoba untuk memahami
seberapa jauh masing­masing X1, X2 dan X3 memiliki arti penting dalam fungsi dan
bagaimana saling berinteraksi. Secara matematik, loading factor dapat dihitung
dengan formulasi :
λ = Rw D
di mana,
λ = matriks loading factor,
Rw = matriks korelasi antara variabel bebas,
D = matriks koefisien fungsi diskriminan yang distandardisasi.
Loading factor ini lebih menjelaskan dominasi variabel bebas terhadap kemampuan
fungsi untuk mengklasifikasi kelompok yang diamati.
d.2 Signifikansi statistik.
Beberapa ukuran signifikansi statistik yang tersedia untuk Analisis Diskriminan
adalah : (1) Wilk’s lambda, (2) Hotelling’s trace, (3) Mahalanobi’s D2, (4) Rao’s
V, dan (5) Pillai’s criterion.
Jika metode stepwise yang digunakan untuk mengestimasi fungsi, maka ukuran
Mahalanobi’s D2 dan Rao’s V lebih tepat digunakan sebagai uji signifikansi fungsi.
Keduanya mengukur jarak yang digeneralisasi. Prosedur pengukuran jarak
Mahalanobi didasari pada kuadrat jarak Euclidean yang digeneralisasi dan
menyesuaikan varians yang tidak setara. Keunggulan utama prosedur uji ini
adalah : D2 diukur dalam ruang original variabel bebas. Kelemahan ukuran D2
untuk uji signifikansi fungsi adalah : ukuran ini menjadi kritis dengan variabel
bebas yang bertambah banyak, karena ukuran itu tidak dihasilkan pada setiap
pengurangan dimensi. Kehilangan dimensionalitas akan mengurangi informasi
karena hal itu mengurangi variabilitas variabel independen. Secara umum, D2
lebih disarankan dipakai jika peneliti menginginkan pemanfaatan maksimal dari
informasi yang ada.
Untuk banyaknya kelompok lebih dari dua, maka peneliti harus menguji juga
signifikansi setiap fungsi antar kelompok, tidak hanya uji signifikansi fungsi
secara total. Program komputer menghasilkan seluruh informasi yang

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 15


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

dibutuhkan untuk menentukan banyaknya fungsi yang dibutuhkan untuk


menghasilkan signifikansi total, tanpa melibatkan fungsi yang tidak
meningkatkan kemampuan mendiskriminasi secara total. Jika sebuah fungsi atau
lebih diperkirakan tidak signifikan, model diskriminan akan diestimasi ulang
dengan banyaknya fungsi yang akan diturunkan terbatas hanya kepada fungsi
yang signifikan saja.
d.3 Menguji kecocokan model secara keseluruhan.
Sekali fungsi diskriminan telah teruji signifikansinya, maka perlu dilakukan uji
kecocokan model secara keseluruhan. Uji ini terdiri atas tiga hal, yaitu : (1)
menghitung Z­skor untuk setiap pengamatan, (2) mengevaluasi selisih Z­skor
kelompok dan (3) mengevaluasi tingkat akurasi prediksi fungsi kepada setiap
pengamatan individual.
(1) Menghitung Z­skor.
Nilai Z dihitung dari fungsi diskriminan eksplisit yang dihasilkan dari fungsi
implisit :
Zjk = a + W1 X1k + W2 X2k + . . . + Wn Xnk
Di mana,
Zjk = Z­skor diskriminan fungsi­j untuk pengamatan­k,
a = intercept,
Wi = koefisien diskriminan untuk variabel bebas­i,
Xik = variabel bebas­i untuk pengamatan­k.
Skor ini bersifat metrik, memberikan arti langsung untuk membandingkan
pengamatan­pengamatan pada setiap fungsi. Pengamatan dengan Z­skor
yang sama diasumsi lebih dianggap sebagai variabel yang membentuk fungsi
daripada perbedaan skor semata.
Fungsi eksplisit yang dihasilkan dalam dua bentuk, yaitu (a) standardized
dan (b) unstandardized. Fungsi standardized lebih bermanfaat untuk
menginterpretasikan hasil, sedang unstandarized digunakan untuk
menghitung Z­skor.
Perlu dicatat, bahwa fungsi diskriminan berbeda dengan fungsi klasifikasi
atau yang disebut sebagai Fisher’s linear discriminant function. Fungsi
klasifikasi, satu untuk setiap kelompok, dapat digunakan untuk
mengklasifikasi pengamatan. Pada metode klasifikasi ini, sebuah nilai
pengamatan untuk variabel bebas disisipkan ke dalam fungsi klasifikasi dan
sebuah skor klasifikasi untuk setiap kelompok dihitung untuk pengamatan
yang bersangkutan. Pengamatan itu kemudian diklasifikasi ke dalam
kelompok yang memiliki skor klasifikasi tertinggi. Fungsi diskriminan
digunakan sebagai rata­rata klasifikasi karena fungsi itu memberikan
representasi yang sederhana dan konsisten pada setiap fungsi diskriminan,
menyederhanakan proses interpretasi dan memberi penilaian terhadap
kontribusi variabel­variabel bebas.
(2) Evaluasi Perbedaan/Selisih Kelompok.
Peneliti dapat mengartikan bahwa menguji kecocokan model secara
keseluruhan adalah menentukan ukuran perbedaan antara anggota setiap
kelompok melalui Z­skor. Intisari ukuran perbedaan kelompok adalah
perbandingan cetroids kelompok, yaitu rata­rata Z­skor untuk seluruh
pengamatan anggota kelompok. Jarak antar centoids disebut sebagai jarak

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 16


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Mahalanobi, D2. Peneliti harus yakin bahwa fungsi diskriminan yang


signifikan akan memberikan jarak centroids signifikan.
Centroids kelompok pada setiap fungsi diskriminan dapat diploting untuk bisa
lebih memperlihatkan hasil ditinjau dari prespektif global. Plot biasanya
disiapkan untuk fungsi diskriminan ke­satu, ke­dua atau ke­tiga (dengan
asumsi fungsi­fungsi tersebut signifikan dapat memprediksi kelompok secara
valid).
(3) Evaluasi Tingkat Akurasi Klasifikasi Fungsi.
Dengan variabel dependen yang bersifat non metrik, maka penggunaan R2
tidak dapat dilakukan sebagai ukuran akurasi model. Untuk mengukur
akurasi fungsi melalui ketepatan prediksi anggota kelompok ke dalam
kelompok awalnya (correctly classification, atau CC). Untuk itu, beberapa hal
perlu dilakukan, yaitu : kembangkan matriks klasifikasi, tentukan Zcutoff, dan
standard atau kriteria klasifikasi.
CC mirip dengan R2 pada Analisis Regresi, dan D2 (dengan uji χ2) sama
dengan F­ratio.
Zcutoff sebagai skor Z yang dipakai sebagai batas pemisahan antar kelompok
dihitung dengan formula :
ZA + ZB
ZCE =
2
ZCE = Zcutoff untuk kelompok dengan ukuran pengamatan yang sama,
ZA = cetroids kelompok A,
ZB = cetroids kelompok B.
Untuk ukuran pengamatan yang tidak sama, Zcutoff dihitung dengan formula :
NA ZB + NB ZA
ZCU =
NA + NB
ZCU = Zcutoff untuk kelompok dengan ukuran pengamatan tidak sama,
NA = ukuran pengamatan untuk kelompok A,
NB = ukuran pengamatan untuk kelompok B.
Ukuran­ukuran ini menjadi optimal dengan asumsi bahwa kelompok
berdistribusi normal dan struktur dispersi kelompok diketahui.

ZCE

Kelompok A Kelompok B

ZA ZB

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 17


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

ZCU

Kelompok B

Kelompok A

ZA ZB

Kriteria klasifikasi adalah dengan membandingkan Z­skor setiap pengamatan


individual pada kelompok dengan Zcutoff.
­ klasifikasikan pengamatan ke dalam kelompok A, jika Z­skor < Zcutoff,
­ klasifikasikan pengamatan ke dalam kelompok B, jika Z­skor > Zcutoff.
Contoh hasil prosedur klasifikasi dapat ditunjukkan dalam matriks berikut :
Tabel 7. Matriks Klasifikasi Untuk Analisis Diskriminan Dua Kelompok.
Prediksi Kelompok Anggota Kelompok
Kelompok Aktual % CC
1 2 Aktual
1 22 3 25 88
2 5 20 25 80
Prediksi Anggota
27 23 50 84*
Kelompok
Keterangan :
% CC = (jumlah klasifikasi benar/total pengamatan) x 100%.
= (22 + 20)/50 x 100% = 84%.
Selanjutnya lakukan uji signifikansi terhadap persentase CC dengan uji­t :
­ untuk ukuran pengamatan dalam kelompok yang sama maupun tidak
sama :
p – 0.5
t=
√{(0.5)(1.0 – 0.5)/N}
di mana,
N =ukuran sampel keseluruhan,
p = proporsi klasifikasi benar.
Pertanyaan yang timbul kemudian adalah : berapa kriteria CC atau hit ratio
(C) yang dianggap cukup memadai tingkat akurasi prediksi fungsi
diskriminan ? 60%, 75% atau 90% ? Untuk menjawab pertanyaan ini,
peneliti secara awal harus menentukan kemungkinan persentase yang akan
diklasifikasi dengan benar, tanpa bantuan fungsi diskriminan. Jika ukuran
sampel pada tiap kelompok sama banyak, penentuan kemungkinan
kebenaran klasifikasi : C = 1/banyaknya kelompok. Untuk dua kelompok, C
= 50%, untuk tiga kelompok, C = 33,33% dan seterusnya.
Untuk ukuran sampel pada tiap kelompok tidak sama, penentuan C dapat
dilakukan dengan pendekatan maximum chance criterion, yaitu mengacu
kepada kelompok dengan ukuran sampel terbesar. Contoh, jika kelompok­1
= 75 sampel dan kelompok­2 = 25 sampel, maka C = 75%.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 18


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Pendekatan lain untuk menentukan C adalah proportional chance criterion :


CPRO = p2 + (1 – p)2
Di mana,
p = proprosi sampel pada kelompok­1,
1 – p = proporsi sampel pada kelompok­2.
Contoh, untuk sampel kelompok­1 = 75 dan kelompok­2 = 25, maka C =
(75%)2 + (25%)2 = 62.50%.
Pendekatan penentuan C dengan berbagai pendekatan menjadi berarti, jika
peneliti menggunakan holdout sample (split­sample approach). Jika CC lebih
kecil daripada C, walaupun signifikan, maka fungsi diskriminan eksplisit yang
dihasilkan menjadi kurang dapat diinterpretasikan. Ada suatu konvensi para
ahli yang menyatakan bahwa CC > 1.25 kali lebih besar daripada C.
Ukuran statistik untuk mengukur kemampuan mendiskriminasi dari matriks
klasifikasi adalah Press’s Q Statistic. Ukuran ini membandingkan jumlah
sampel yang diklasifikasi secara benar dengan total sampel dan banyaknya
kelompok. Formula untuk Press’s Q Statistic adalah :
[ N – nK]2
Press’s Q =
N( k ­1)
Di mana,
N = ukuran total sampel,
n = banyaknya sampel yang diklasifikasi dengan benar,
K = banyaknya kelompok.
Press’s Q Statistic diuji signifikansinya dengan uji­χ2 pada α tertentu dengan
degree of freedom = 1. Jika Press’s Q Statistic > χ2α,df, maka CC hasil
perhitungan memang berbeda dengan C.
Casewise Diagnostic.
Untuk memperoleh kecocokan model dalam memprediksi, bisa dilakukan dengan
menghitung hasil prediksi selangkah demi selangkah. Langkah ini dimaksudkan
untuk : (1) mengetahui pengamatan yang salah diklasifikasi, dan (2) untuk
pengamatan yang tidak representatif pada sisa pengamatan dalam kelompok.
Walaupun fungsi diskriminan menghasilkan matriks klasifikasi yang menjelaskan
akurasi klasifikasi secara keseluruhan, tetapi tidak menghasilkan detil klasifikasi
kepada pengamatan individual.
Mencari kesalahan klasifikasi pada pengamatan individual perlu dilakukan untuk
mengidentifikasi karakteristik apakah yang ada pada pengamatan individual
tersebut yang tidak memberi kontribusi positif terhadap akurasi kemampuan
klasifikasi fungsi yang dihasilkan. Analisis dapat dilakukan kepada pengamatan
individual yang salah diklasifikasi maupun kepada variabel­variabel bebas yang
tidak dimasukkan ke dalam model.
e. Tahap 5 : Interpretasi Hasil.
Setelah fungsi diskriminan eksplisit diperoleh dan akurasi klasifikasi terbukti tinggi
secara statistik, maka selanjutnya peneliti dapat melakukan interpretasi hasil. Proses
ini merupakan tahap bagaimana menjelaskan peringkat urgensi relatif masing­
masing variabel bebas dalam mendiskriminasi kelompok. Ada tiga pendekatan
metode yang dapat digunakan, yaitu : (1) melalui perbandingan standardized

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 19


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

coefficients diskriminan, (2) discriminant loadings (korelasi struktur) dan (3) partial
F­value.
(1) Standardized discriminant coefficients.
Ini merupakan pendekatan tradisional untuk menginterpretasi hasil analisis. Jika
tanda matematik koefisien diskriminan diabaikan, maka nilai koefisien
merupakan kontribusi relatif masing­masing variabel bebas terhadap fungsi.
Variabel independen dengan koefisien yang lebih besar dapat dijelaskan bahwa
variabel tersebut lebih besar kontribusinya dalam mendiskriminasi kelompok.
Tanda matematik hanya menjelaskan kontribusi positif atau negatif.
(2) Discriminant loadings.
Bertahun­tahun yang lalu, discriminant loadings digunakan sebagai basis untuk
menginterpretasi hasil, karena memperbandingkan standardized discriminant
coefficients kadang­kadang masih mengandung kelemahan yang disebabkan
adanya multikolinieritas. Discriminant loadings merupakan korelasi linier
struktural antara masing­masing variabel bebas dengan fungsi diskriminan.
Discriminant loadings merefleksikan variansi tingkat sumbangan relatif variabel
independen terhadap fungsi diskriminan dan bisa diinterpretasi seperti factor
loadings dalam menilai sumbangan relatif masing­masing variabel independen
terhadap fungsi diskriminan. Discriminant loadings dianggap lebih valid daripada
standardized discriminant coefficients dalam mengartikan kemampuan
mendiskriminasi masing­masing variabel independen karena sifat korelatifnya.
Walupun demikian, peneliti tetap harus berhati­hati dalam menggunakan
pendekatan ini untuk menginterpretasi hasil.
(3) Partial F­value.
Seperti telah dinyatakan di atas, ada dua pendekatan teknik komputasi, yaitu :
simultan dan stepwise. Jika peneliti menggunakan metode stepwise, maka
tersedia informasi tambahan yang bisa diinterpretasikan tentang kemampuan
mendiskriminasi setiap variabel independen, melalui nilai F parsial. Makin besar
nilai F parsial, makin besar pula kemampuan mendsikriminasi variabel
independen yang bersangkutan. Secara umum, perbandingan nilai F parsial ini
sama dengan memperbandingkan standardized discriminant coefficients, namun
perbandingan ini telah lebih terbatas kepada koefisien­koefisien diskriminan
yang signifikan.
Dalam menginterpretasi dua fungsi diskriminan atau lebih, seringkali ditemui
persoalan, yaitu : (1) apakah peneliti dapat menyederhanakan koefisien diskriminan
untuk memberikan profil kepada setiap fungsi ? (2) bagaimana peneliti dapat
menjelaskan pengaruh silang variabel bebas pada fungsi­fungsi diskriminan yang
dihasilkan ? Untuk menjawab persoalan itu, ada tiga teknik yang bisa digunakan,
yaitu : (1) teknik rotasi fungsi, (2) teknik potency index dan (3) teknik grafis untuk
koefisien diskriminan.
(1) Teknik rotasi fungsi diskriminan.
Rotasi fungsi ditujukan untuk melakukan distribusi ulang varians. Teknik rotasi
yang lebih sering digunakan adalah VARIMAX atau disebut sebagai rotasi
orthogonal (dengan sumbu­sumbu yang tetap 90o, saling tegak lurus) daripada
rotasi oblique (sumbu­sumbu tidak harus saling tegak lurus), seperti VARTIMAX,
EQUIMAX3. Dengan rotasi ini, maka nilai koefisien diskriminan yang tidak terlalu

3
SPSS memberikan rotasi OBLIMIN, SAS memberikan PROMAX dan ORTHOBLIQUE.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 20


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

berbeda dengan lainnya akan menjadi signifikan perbedaannya, sehingga


interpretasinya bisa lebih tajam.
(2) Teknik potency index.
Potency index merupakan ukuran relatif kemampuan mendiskriminasi untuk
seluruh variabel independen pada seluruh fungsi diskriminan yang dihasilkan.
Ukuran ini mengindikasikan dua hal, yaitu : (a) kontribusi setiap variabel
independen (discriminant loadings) dan (b) eigenvalue relatif di antara fungsi­
fungsi. Walaupun potency index terhitung, namun ini sekedar rank kontribusi
masing­masing variabel independen saja.
Prosedur menghitung potency index adalah :
Langkah­1 : hitung nilai potensi fungsi diskriminan yang signifikan. Nilai potensi
dapat dihitung dengan formula :
PIij = (Discriminant Loadingij)2 x relative eigenvalue fungsi­j.
Di mana,
PIij = potency index variabel independen­i pada fungsi­j.
Relative eigenvalue fungsi­j (REVj) dihitung dengan formula :
Eigenvalue of discriminant function­j
REVj =
Sum of eigenvalues across all significant functions
Langkah­2 : hitung potency index komposit seluruh fungsi signifikan.
Sekali potency value (langkah­1) telah terhitung untuk setiap fungsi, potency
index komposit dapat dihitung sebagai jumlah potency value dari setiap fungsi
diskriminan signifikan. Potency index merepresentasikan total efek pen­
diskriminasian dari variabel pada seluruh fungsi diskriminan signifikan. Walaupun
ini merupakan ukuran relatif, namun nilai absolutnya tidak memberikan arti
yang substantif.
(3) Teknik grafis discriminant loadings.
Untuk menggambarkan perbedaan­perbedaan dalam kelompok variabel
prediktor, peneliti dapat membuat plot discriminant loading. Pendekatan yang
paling sederhana adalah memplotting loadings yang telah dirotasi aktual atau
loadings yang tidak dirotasi dalam sebuah grafik. Tetapi disarankan, plotting
loadings yang telah dirotasi. Teknik yang lebih akurat adalah teknik yang
melibatkan stretching the vectors. Yang dimaksud vectors dalam hal ini adalah
sebuah garis lurus yang ditarik dari titik origin dari sebuah grafik menuju ke titik
koordinat loading variabel tertentu. Panjang setiap vektor mengindikasikan
tingkat kepentingan relatif setiap variabel dalam mendiskriminasi dalam
kelompok. Untuk memperbesar (stretching) vektor, dapat mengkalikan
discriminant loading (disarankan setelah dirotasi) dengan nilai­F univariat yang
berkaitan.
Proses plotting selalu melibatkan seluruh variabel signifikan yang masuk dalam
model. Bisa juga dilakukan plotting variabel lain yang memiliki nilai­F univairat
signifikan walaupun tidak signifikan dalam model. Prosedur ini menunjukkan
pentingnya variabel kolinier yang tidak masuk ke dalam model, seperti pada
teknik stepwise. Melalui penggunaan prosedur ini dapat dicatat bahwa titik
vektor menuju ke kelompok memiliki rata­rata skor tertinggi pada prediktor yang
terkait dan jauh dari kelompok yang memiliki rata­rata skor terendah. Centroid
kelompok bisa diperbesar dengan prosedur ini dengan mengkalikannya kepada

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 21


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

nilai­F univariat yang berkaitan dengan setiap fungsi diskriminan yang


dihasilkan. Jika loadings diperbesar, maka centroid kelompok juga harus
diperbesar agar bisa memplotting dengan akurat pada grafik yang sama.
Aproksimasi nilai­F untuk setiap fungsi diskriminan diperoleh dengan
menggunakan formula berikut :
estimation sample size – no. of groups
F­valuefunction­i = eigenvaluefunction­i
No. of groups – 1
Sebagai contoh, sampel = 50 yang dibagi dalam tiga kelompok. Multiplier setiap
eigenvalue adalah = (50 – 3)/(3 ­ 1) = 23.5.4
Sebuah alternatif untuk memperbesar vektor dan centroids adalah dengan
membuat “territorial map” (fasilitas ini pada Program SPSS), yang memplot
centroids dan batas untuk setiap kelompok.
f. Tahap­6 : Validasi Hasil.
Tahap terakhir adalah mevalidasi hasil untuk menjamin hasil diskriminan memiliki
validasai internal maupun eksternal. Dengan adanya kecenderungan dari analisis
diskriminan yang akan meningkatkan hit ratio jika dievaluasi hanya melalui analisis
sampel saja, maka cross­validation merupakan langkah yang cukup penting.
Seringkali cross­validation telah dilakukan dengan sampel orisinal, tetapi hal itu
memungkinkan untuk menambah tambahan sampel sebagai sampel cadangan (hold
out). Sebagai tambahan kepada cross­validation, biasanya peneliti akan
menggunakan sampel tambahan/cadangan yang tidak dilibatkan pada saat
mengestimasi koefisien diskriminan untuk menyakinkan bahwa rata­rata kelompok
merupakan indikator yang valid dari konseptual model dalam memilih variabel­
variabel independennya.

4. Statistik Untuk Analisis Diskriminan.


Statistik yang penting dan berkaitan dengan analisis diskriminan adalah :
a. Canonical Correlation.
Canonical correlation merupakan ukuran tingkat hubungan antara skor diskriminan
dengan kelompok. Ini mengukur hubungan antara fungsi diskriminan tunggal dengan
sekelompok variabel dummy yang mendefinisikan keanggotaan kelompok.
b. Centroid.
Centroid adalah rata­rata skor diskriminan dari suatu kelompok tertentu. Ada sejumlah
nilai centroid sesuai dengan jumlah kelompok.
c. Classification Matrix.
Matriks ini sering disebut juga sebagai confusion atau prediction matrix. Matriks ini
menunjukkan jumlah observasi yang diklasifikasi secara benar dan tidak benar.
Klasifikasi observasi yang benar muncul pada diagonal matriks, karena kelompok yang
diprediksi sama dengan kelompok aktual. Elemen matriks di luar diagonal menjelaskan
klasifikasi observasi yang tidak benar. Jumlah elemen diagonal dibagi dengan banyaknya
observasi disebut sebagai hit ratio.

4
Lihat Dillon dan Goldstein.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 22


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

d. Discriminant Function Coefficients.


Koefisien fungsi diskriminan (unstandardized) adalah multiplier dari masing­masing
variabel di mana nilai variabel tersebut dalam ukuran satuan yang orisinal.
e. Discriminant Score.
Koefisien diskriminan yang unstandardized dikalikan dengan nilai masing­masing
variabel. Hasilnya dijumlahkankan dengan konstanta untuk menghasilkan skor
diskriminan.
f. Eigenvalue.
Untuk setiap fungsi diskriminan, eigenvalue merupakan ratio jumlah kuadrat antar
kelompok dengan jumlah kudrat dalam kelompok. Eigenvalue yang besar menunjukkan
fungsi superior.
g. F­values and their significance.
Ini dihitung dengan one­way ANOVA, dengan pengelompokan variabel yang berperan
sebagai variabel independen katagorial. Selanjutnya, setiap prediktor diperankan sebagai
variabel dependen yang bersifat metrik dalam tabel ANOVA.
h. Group Means and Group Standard Deviations.
Ukuran­ukuran ini dihitung untuk setiap prediktor pada setiap kelompok.
i. Pooled within­group Correlation Matrix.
The pooled within­group correlation matrix dihitung dengan merata­rata matriks
kovarians yang terpisah untuk seluruh kelompok.
j. Standardized Discriminant Function Coefficients.
Koefisien fungsi diskriminan terstandard digunakan sebagai bilangan pengali variabel­
variabel yang telah distandardisasi sebagai variabel dengan nilai rata­rata = 0 dan
varians = 1.
k. Structure Correlations.
Juga disebut sebagai discriminant loadings, merupakan korelasi struktural
menggambarkan korelasi sederhana antar variabel prediktor dan fungsi diskriminan.
l. Total Correlation Matrix.
Merupakan ukuran korelasi seluruh sampel tanpa memperhatikan dari kelompok mana ia
berasal.
m. Wilk’s λ.
Kadang­kadang disebut juga sebagai U­statistic. Wilk’s λ untuk setiap prediktor
merupakan ratio within­group sum of squares kepada total sum of squares. Nilainya
berkisar antara 0 dan 1. Makin besar nilai λ (mendekati 1) mengindikasikan bahwa rata­
rata kelompok­kelompok tampak dianggap tidak berbeda; sebaliknya makin kecil nilai λ
(mendekati 0), mengindikasikan bahwa rata­rata kelompok dianggap berbeda.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 23


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

5. Contoh Lain : Kunjungan Liburan.


Sebuah penelitian yang bermaksud mengetahui perbedaan karakteristik rumah tangga yang
mengunjungi daerah wisata tertentu dalam dua tahun terakhir dengan keluarga yang tidak
mengunjungi daerah wisata tersebut dalam dua tahun terakhir. Data dikumpulkan dari 42
buah rumah tangga, di mana 30 buah rumah tangga sebagai sampel yang dianalisis, sedang
sisanya, 12 buah rumah tangga sebagai sampel cadangan (hold out) untuk validasi model
yang dihasilkan.
Data dari 30 buah sampel keluarga yang dianalisis adalah :
Sikap Pentingnya Jumlah Usia Jumlah
Kunjungan Pendapatan
No. Terhadap Bagi Anggota Kepala Pengeluaran
Wisata Keluarga/th
Perjalanan Keluarga Keluarga Keluarga Wisata

1 1 50.2 5 8 3 43 2
2 1 70.3 6 7 4 61 3
3 1 62.9 7 5 6 52 3
4 1 48.5 7 5 5 36 1
5 1 52.7 6 6 4 55 3
6 1 75.0 8 7 5 68 3
7 1 46.2 5 3 3 62 2
8 1 57.0 2 4 6 51 2
9 1 64.1 7 5 4 57 3
10 1 68.1 7 6 5 45 3
11 1 73.4 6 7 5 44 3
12 1 71.9 5 8 4 64 3
13 1 56.2 1 8 6 54 2
14 1 49.3 4 2 3 56 3
15 1 62.0 5 6 2 58 3
16 2 32.1 5 4 3 58 1
17 2 36.2 4 3 2 55 1
18 2 43.2 2 5 2 57 2
19 2 50.4 5 2 4 37 2
20 2 44.1 6 6 3 42 2
21 2 38.3 6 6 2 45 1
22 2 55.0 1 2 2 57 2
23 2 46.1 3 5 3 51 1
24 2 35.0 6 4 5 64 1
25 2 37.3 2 7 4 54 1
26 2 41.8 5 1 3 56 2
27 2 57.0 8 3 2 36 2
28 2 33.4 6 8 2 50 1
29 2 37.5 3 2 3 48 1
30 2 41.3 3 3 2 42 1

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 24


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Keterangan :
­ Kunjungan wisata = 1, untuk keluarga yang mengunjungi obyek wisata tertentu dalam
dua tahun terakhir, = 2 untuk keluarga yang tidak mengunjungi obyek wisata dalam dua
tahun terakhir.
­ Pendapatan keluarga/tahun dalam ribuan dollar.
­ Sikap terhadap perjalanan (skor 1 sampai 9, sangat tidak suka – sangat menyukai).
­ Pentingnya bagi keluarga (skor 1 sampai 9, sangat tidak penting – sangat penting).
­ Jumlah anggota keluarga (dalam satuan orang).
­ Usia kepala keluarga (dalam satuan tahun).
­ Jumlah pengeluaran untuk wisata (1 = rendah, 2 = moderat, dan 3 = tinggi).
Hasil analisis dengan SPSS Version 12.00 adalah sebagai berikut :
Discriminant
Analysis Case Processing Summary
Unweighted Cases N Percent
Valid 30 100,0
Excluded Missing or out-of-
range group codes 0 ,0
At least one
missing
0 ,0
discriminating
variable
Both missing or
out-of-range group
codes and at least
0 ,0
one missing
discriminating
variable
Total 0 ,0
Total 30 100,0

Group Statistics
Visit Mean Std. Deviation Valid N (listwise)
Unweighted Weighted
1 Income 60,520 9,8307 15 15
Attitude 5,400 1,9198 15 15
Importance 5,800 1,8205 15 15
Hsize 4,333 1,2344 15 15
Age 53,733 8,7706 15 15
2 Income 41,913 7,5511 15 15
Attitude 4,333 1,9518 15 15
Importance 4,067 2,0517 15 15
Hsize 2,800 ,9411 15 15
Age 50,133 8,2710 15 15
Total Income 51,217 12,7952 30 30
Attitude 4,867 1,9780 30 30
Importance 4,933 2,0998 30 30
Hsize 3,567 1,3309 30 30
Age 51,933 8,5740 30 30

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 25


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Keterangan :
Kode Visit = 1 (keluarga yang melakukan perjalanan ke obyek wisata dalam dua tahun
terakhir).
Mean = rata­rata income = 60,520
Std. Deviation = standard deviasi income = 9,8307, dst.
Kode visit = 2 (keluarga yang tidak melakukan perjalanan ke obyek wisata dalam dua tahun
terakhir).
Mean = rata­rata income = 41,913
Std. Deviation = standard deviasi income = 7,5511, dst.
Total adalah rata­rata dan standard deviasi keseluruhan data.
a
Pooled Within-Groups Matrices
Income Attitude Importance Hsize Age
Covariance Income 76,831 3,350 1,555 ,855 -1,070
Attitude 3,350 3,748 ,317 -,036 -3,252
Importance 1,555 ,317 3,762 ,150 ,288
Hsize ,855 -,036 ,150 1,205 -,402
Age -1,070 -3,252 ,288 -,402 72,667
Correlation Income 1,000 ,197 ,091 ,089 -,014
Attitude ,197 1,000 ,084 -,017 -,197
Importance ,091 ,084 1,000 ,070 ,017
Hsize ,089 -,017 ,070 1,000 -,043
Age -,014 -,197 ,017 -,043 1,000
a
The covariance matrix has 28 degrees of freedom.
Keterangan :
Matriks korelasi dalam kelompok gabungan dihitung dengan merata­rata matriks kovarians
yang terpisah untuk seluruh kelompok.

Analysis 1
Summary of Canonical Discriminant Functions
Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
1 a
1,786 100,0 100,0 ,801
a
First 1 canonical discriminant functions were used in the analysis.
Keterangan :
Canonical correlation = 0,801 atau 80,10% merupakan ukuran tingkat hubungan antara skor
diskriminan dengan kelompok. Analog dengan R2 pada Analisis Regresi.

Wilks' Lambda
Wilks'
Test of Function(s) Lambda Chi-square df Sig.
1 ,359 26,130 5 ,000

Keterangan :
Wilk’s λ = 0,359 dan signifikan pada α = 0,000 dengan uji χ2 = 26,130. Menunjukkan bahwa
perbedaan rata­rata kelompok (centroid) keluarga­1 dan keluarga­2 berbeda secara
signifikan.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 26


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Standardized Canonical Discriminant Function Coefficients


Function
1
Income ,743
Attitude ,096
Importance ,233
Hsize ,469
Age ,209

Keterangan :
Fungsi diskriminan yang dihasilkan dalam bentuk standardized coefficient adalah :
Zjk = 0,743 X1k + 0,096 X2k + 0,233 X3k + 0,469 X4k + 0,209 X5k
Di mana,
X1 = family income,
X2 = attitude,
X3 = vacation importance,
X4 = household size,
X5 = age of head of household.

Structure Matrix
Function
1
Income ,822
Hsize ,541
Importance ,346
Attitude ,213
Age ,164
Pooled within-groups correlations between discriminating variables and standardized canonical
discriminant functions Variables ordered by absolute size of correlation within function.

Canonical Discriminant Function Coefficients


Function
1
Income ,085
Attitude ,050
Importance ,120
Hsize ,427
Age ,025
(Constant) -7,975
Unstandardized coefficients
Keterangan :
Fungsi diskriminan yang dihasilkan dalam bentuk unstandardized coefficient adalah :
Zjk = ­7,975 + 0,085 X1k + 0,050 X2k + 0,120 X3k + 0,427 X4k + 0,025 X5k

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 27


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Group covariances of canonical discriminant functions


Visit Function 1
1 1 1,291
2 1 -1,291
Unstandardized canonical discriminant functions
Evaluated at group means.

Classification Statistics
Classification Processing Summary
Processed 30
Excluded Missing or out-of-
range group codes 0
At least one missing
discriminating 0
variable
Used in Output 30

Prior Probabilities for Groups


Cases Used in Analysis
Visit Prior
Unweighted Weighted
1 ,500 15 15,000
2 ,500 15 15,000
Total 1,000 30 30,000

Classification Function Coefficients


Visit
1 2
Income ,678 ,459
Attitude 1,509 1,381
Importance ,938 ,628
Hsize 3,322 2,218
Age ,832 ,768
(Constant) -57,532 -36,936
Fisher's linear discriminant functions

Tests of Equality of Group Means


Wilks'
Lambda F df1 df2 Sig.
Income ,453 33,796 1 28 ,000
Attitude ,925 2,277 1 28 ,143
Importance ,824 5,990 1 28 ,021
Hsize ,657 14,636 1 28 ,001
Age ,954 1,338 1 28 ,257
Keterangan :
Tiga variabel bebas merupakan variabel yang signifikan dalam mendiskriminasi, yaitu :
income (sig. = 0,000), importance (sig. = 0,021) dan hsize (sig. = 0,001).

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 28


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

a
Classification Results
Predicted Group
Membership
Visit 1 2 Total
Original Count 1 12 3 15
2 0 15 15
% 1 80,0 20,0 100,0
2 ,0 100,0 100,0
a
90,0% of original grouped cases correctly classified.
Keterangan :
Persentase klasifikasi observasi ke dalam kelompok yang benar = 90,00%. Artinya observasi
dari kelompok­1 diprediski sebagai kelompok­1, dan observasi dari kelompok­2 diprediksi
sebagai kelompok­2 = (12 + 15)/30 = 0,9000 atau 90,00%.
Validasi model dengan menggunakan sampel cadangan yang tidak dilibatkan dalam
menghitung koefisien diskriminan (sebanyak 12 buah sampel holdout) dapat dilakukan
dengan menggunakan fungsi disklriminan dalam bentuk unstandardized coefficients.
Territorial map yang dihasilkan dalam validasi ini adalah :
a. hitung Zscore setiap observasi dari sampel cadangan dengan fungsi unstandardized,
hasilnya adalah :
Visit aktual Zscore ZCE* Prediksi visit
1 ­0.211 0 2
1 2.625 0 1
1 0.913 0 1
1 ­0.639 0 2
1 2.537 0 1
1 0.9545 0 1
2 ­1.382 0 2
2 ­0.039 0 2
2 ­1.345 0 2
2 ­0.6 0 2
2 ­0.4265 0 2
2 ­1.882 0 2
*
ZCE dihitung sebagai :
ZA + ZB 1,291 + (­1,291)
ZCE = = =0
2 2
b. bila Zscore > ZCE, maka observasi terebut diprediksi sebagai kelompok­1,
c. bila Zscore < ZCE, maka observasi terebut diprediksi sebagai kelompok­2.
a
Classification Results
Predicted Group
Membership
Visit 1 2 Total
Original Count 1 4 2 6
2 0 6 6
% 1 66,67 33,33 100,0
2 ,0 100,0 100,0
a
83,33% of original grouped cases correctly classified.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 29


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Dari hasil validasi dengan sampel cadangan, tampak ada penurunan persentase klasifikasi
observasi kepada kelompoknya dengan benar, dari 90,00% menjadi 83,33%. Ini bisa
disebabkan karena ada dua variabel bebas yang tidak signifikan, yaitu : attitude dan age.
Maka beralasan sekali untuk membuat model dengan tiga variabel signifikan saja.
Jika kasus di atas dirubah topiknya, yaitu : apakah yang membedakan pengeluaran
keluarga untuk wisata (family spent) Model implisitnya adalah :
Zjk = a + W1 X1k + W2 X2k + . . . + W5 X5k
Di mana,
Zjk = family spent for vacation dengan tiga katagori : 1 = low, 2 = moderat dan 3 = high,
X1 = family income, X2 = attitude, X3 = vacation importance, X4 = household size, dan
X5 = age of head of household.
Hasil SPSS untuk perubahan topik ini adalah :
Discriminant
Analysis Case Processing Summary
Unweighted Cases N Percent
Valid 30 100,0
Excluded Missing or out-of-range group codes 0 ,0
At least one missing discriminating variable 0 ,0
Both missing or out-of-range group codes and at
least one missing discriminating variable 0 ,0
Total 0 ,0
Total 30 100,0

Group Statistics
Spent Mean Std. Deviation Valid N (listwise)
Unweighted Weighted
1 Income 38,570 5,2972 10 10
Attitude 4,500 1,7159 10 10
Importance 4,700 1,8886 10 10
Hsize 3,100 1,1972 10 10
Age 50,300 8,0973 10 10
2 Income 50,110 6,0023 10 10
Attitude 4,000 2,3570 10 10
Importance 4,200 2,4855 10 10
Hsize 3,400 1,5055 10 10
Age 49,500 9,2526 10 10
3 Income 64,970 8,6143 10 10
Attitude 6,100 1,1972 10 10
Importance 5,900 1,6633 10 10
Hsize 4,200 1,1353 10 10
Age 56,000 7,6012 10 10
Total Income 51,217 12,7952 30 30
Attitude 4,867 1,9780 30 30
Importance 4,933 2,0998 30 30
Hsize 3,567 1,3309 30 30
Age 51,933 8,5740 30 30

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 30


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Tests of Equality of Group Means


Wilks'
Lambda F df1 df2 Sig.
Income ,262 37,997 2 27 ,000
Attitude ,788 3,634 2 27 ,040
Importance ,881 1,830 2 27 ,180
Hsize ,874 1,944 2 27 ,163
Age ,882 1,804 2 27 ,184
Keterangan :
Pada α = 0,05; tampak hanya dua buah variabel saja yang signifikan dalam mendiskriminasi,
yaitu income (sig. = 0,000) dan attitude (sig. = 0,040).

Pooled Within-Groups Matrices


Income Attitude Importance Hsize Age
Correlation Income 1,000 ,051 ,307 ,380 -,209
Attitude ,051 1,000 ,036 ,005 -,340
Importance ,307 ,036 1,000 ,221 -,013
Hsize ,380 ,005 ,221 1,000 -,025
Age -,209 -,340 -,013 -,025 1,000

Analysis 1
Summary of Canonical Discriminant Functions
Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
a
1 3,819 93,9 93,9 ,890
2 a
,247 6,1 100,0 ,445
a
First 2 canonical discriminant functions were used in the analysis.
Keterangan :
Hanya dua buah fungsi diskriminan signifikan yang diperoleh, yaitu fungsi­1 dan fungsi­2.
Perbandingan eigenvalue, menunjukkan bahwa fungsi­1 lebih superior dibanding fungsi­2.

Wilks' Lambda
Wilks'
Test of Function(s) Lambda Chi-square Df Sig.
1 through 2 ,166 44,831 10 ,000
2 ,802 5,517 4 ,238

Keterangan :
Fungsi­1 memiliki Wilk’s λ = 0,166 dengan probabilitas sig. = 0,000 mengindikasikan bahwa
centroid kelompok­1 dan kelompok­2 memang berbeda. Sedang fungsi­2 memiliki Wilk’s λ =
0,802 dengan probabilitas sig. = 0,238, ini mengindikasikan bahwa centroid kelompok­2
tidak berbeda dengan kelompok­3.
Dapat disimpulkan bahwa hanya ada dua kelompok saja yang benar­benar berbeda, yaitu
kelompok keluarga dengan pengeluaran (spent) = 1 dan spent = 2.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 31


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Standardized Canonical Discriminant Function Coefficients


Function
1 2
Income 1,047 -,421
Attitude ,340 ,769
Importance -,142 ,534
Hsize -,163 ,129
Age ,495 ,524

Structure Matrix
Function
1 2
Income *
,856 -,278
Hsize *
,193 ,077
Attitude *
,219 ,588
Importance *
,149 ,454
Age *
,166 ,341
Pooled within-groups correlations between discriminating variables and standardized canonical
discriminant functions Variables ordered by absolute size of correlation within function.
*
Largest absolute correlation between each variable and any discriminant function

Canonical Discriminant Function Coefficients


Function
1 2
Income ,154 -,062
Attitude ,187 ,422
Importance -,070 ,261
Hsize -,127 ,100
Age ,059 ,063
(Constant) -11,094 -3,792
Unstandardized coefficients

Functions at Group Centroids


Function
Spent 1 2
1 -2,041 ,418
2 -,405 -,659
3 2,446 ,240
Unstandardized canonical discriminant functions evaluated at group means

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 32


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Classification Statistics
Classification Processing Summary
Processed 30
Excluded Missing or out-of-
range group codes 0
At least one missing
discriminating 0
variable
Used in Output 30

Prior Probabilities for Groups

Spent Prior Cases Used in Analysis


Unweighted Weighted
1 ,333 10 10
2 ,333 10 10
3 ,333 10 10
Total 1,000 30 30

Classification Function Coefficients


Spent
1 2 3
Income 1,099 1,418 1,802
Attitude 2,904 2,754 3,667
Importance -,002 -,397 -,360
Hsize -,173 -,488 -,759
Age 1,124 1,153 1,379
(Constant) -56,821 -69,018 -106,773
Fisher's linear discriminant functions

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 33


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Territorial Map
Canonical Discriminant Function 2
-6,0 -4,0 -2,0 ,0 2,0 4,0 6,0
.ôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòò òòòòô ò

6,0 ô 13 ó
ô ó 13 ó
ó 13 ó
ó 13 ó
ó 13 ó
ó 13 ó
4,0 ô ô ô ô 13 ô ô ô
ó 13 ó
ó 13 ó
ó 13 ó
ó 13 ó
ó 13 ó
2,0 ô ô ô ô13 ô ô ô
ó 1223 ó
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
ó * 12 23 * ó
,0 ô ô ô 12 ô 23 ô ô ô
ó 12 23 ó
ó 12 * 23 ó
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
-2,0ô ô 12ô ô 23ô ô ô
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
-4,0ô ô 12 ô ô ô23 ô ô
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
ó 12 23 ó
-6,0ô 12 23 ô
ôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòô
-6,0 -4,0 -2,0 ,0 2,0 4,0 6,0

Canonical Discriminant Function 1

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 34


DISKRIMINAN.doc
Kamarul Imam
rul2a@yahoo.com

Symbols used in territorial map


Symbol Group Label
------ ----- --------------------

1 1
2 2
3 3
* Indicates a group centroid
a
Classification Results
Predicted Group Membership
Spent 1 2 3 Total
Original Count 1 9 1 0 10
2 1 9 0 10
3 0 2 8 10
% 1 90,0 10,0 ,0 100,0
2 10,0 90,0 ,0 100,0
3 ,0 20,0 80,0 100,0
a
86,7% of original grouped cases correctly classified.
Keterangan :
Hasil validasi model kepada holdout sample menunjukkan tingkat ketepatan klasifikasinya
menurun sebagai berikut :
a
Classification Results
Predicted Group Membership
Spent 1 2 3 Total
Original Count 1 3 1 0 4
2 0 3 1 4
3 1 0 3 4
% 1 75,0 25,0 ,0 100,0
2 ,0 75,0 25,0 100,0
3 25,0 75,0 ,0 100,0
a
75,0% of original grouped cases correctly classified.

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 35


DISKRIMINAN.doc

Anda mungkin juga menyukai