Multiple Group DA

BAB 9.
Multiple Group Discriminant Analysis
Dalam bab yang lalu kita bahas diskriminan analisis untuk dua kelompok. Namun,
dalam banyak contoh, seseorang tertarik untuk menentukan perbedaan diantara lebih
dari dua kelompok. Misalkan, perhatikan situasi-situasi berikut ini:
1. Seorang manager pemasaran tertarik untuk menentukan factor-faktor yang
secara terbaik membedakan pengguna-pengguna berat, medium, dan ringan
dari suatu product.
2. Pimpinan dari suatu perusahaan telefon tertarik untuk mengidentifikasikan
karakteristik-karakterisitk yang secara terbaik membedakan diantara keluarga-
keluarga yang memiliki satau saluran telefon, dua saluran, tiga saluran telefon
atau lebih.
3. Pimpinan dari suatu perusahan multinasional tertarik untuk
mengidentifikasikan atribut-atribut menonjol yang membedakan pengenalan
produk-produk yang sukses di Negara-negara Amerika Latin, Eropa, Timur Jauh
dan Timur Tengah.
Masing-masing contoh ini melibatkan pembedaan diantara tiga atau empat kelompok.
Multiple Group Discriminant Analysis adalah suatu teknik yang cocok untuk tujuan itu.
Tujuan-tujuan dari MDA sama dengan tujuan-tujuan pada Discriminant analysis dua
kelompok, terkecuali untuk perbedaan-perbedaan berikut ini. Namun, untuk kasus lebih
dari dua kelompok, tidaklah mungkin untuk merepresentasikan atau memperhitungkan
semua perbedaan diantara kelompok berdasarkan suatu fungsi diskriminan tunggal.
Sehingga perlu untuk kita mengidentifikasikan fungsi diskriminan lainnya. Ini berarti,
suatu tujuan tambahan dari MDA adalah mengidentifikasikan fungsi diskriminan
minimum yang akan menyajikan perbedaan-perbedaan diantara kelompok-kelompok.
9.1. Pandangan Geometris dari MDA

Isu mengidentifikasi sekelompok variable yang secara terbaik memperlihatkan
perbedaan diantara kelompok-kelompok adalah sama dengan yang ada pada
diskriminan analisis dua kelompok, karena itu kita tidak sediakan pandangan geometris
untuk tujuan ini. Suatu tujuan tambahan dalam MDA adalah mengidentifikasikan
banyaknya fungsi diskriminan yang diperlukan agar secara terbaik menyajikan
perbedaan-perbedaan diantara kelompok, karena itu kita mulai dengan menyajikan
pandangan geometris tentang tujuan ini.
9.2.1. Berapa banyak fungsi diskriminan yang diperlukan?

Panel 1 pada Gambar 9.1 memberikan suatu scatterplot dari suatu kelompok observasi
(secara hipotetis) dalam ruang variable. Observasi-Observasi ini tentang empat
kelompok dan diukur dalam dua variable X 1 dan X2. Oleh karena itu kita, secara
maksimum hanya bisa memperoleh dua fungsi diskriminan. Terlihat bahwa mean-mean
dari variable X1 dan X2 adalah berbeda untuk empat kelompok ini. Misalkan Z adalah
sumbu yang merepresentasi fungsi discriminan. Seperti yang dibahas dalam bab 8,
proyeksi dari titik-titik pada fungsi diskriminan, Z, memberikan score-score
diskriminan. Skor-skor diskriminan memberikan suatu pemisahan yang baik diantara
keempat kelompok. Artinya, skor-skor diskriminan yang berasal dari fungsi diskriminan
Z adalah cukup untuk menyajikan perbedaan-perbedaan terbaik diantara keempat
kelompok.
Panel II pada Gambar 9.1 menyajikan suatu plot lain dari observasi hipotetis untuk
empat kelompok. Sekali lagi, nyata bahwa mean-mean dari variable X 1 dan X2 untuk
empat kelompok adalah berbeda. Misalkan Z1 adalah sumbu yang merepresentasikan
fungsi diskriminan. Skor-skor diskriminan, yang ditentukan oleh proyeksi dari titik-titik
pada fungsi diskriminnan, Z 1, terlihat menyajikan diskriminasi yang baik diantara
semua pasangan kelompok-kelompok, kecuali kelompok 2 dan 3. Oleh karena itu kita
perlu mengidentifikasikan fungsi diskriminan yang lain agar dapat membedakan
kelompok 2 dan 3. Misalkan Z2 adalah sumbu yang merepresentasi fungsi diskriminan
yang kedua. Fungsi diskriminan yang kedua ini memberikan perbedaan diatara
kelompok-kelompok 2 dan 3, demikian juga membedakan pasangan-pasangan
kelompok lainnya, namun fungsi ini tidak bisa membedakan kelompok 1 dan 4. Oleh
karena itu, agar dapat mempertimbangkan semua perbedaan diantara semua pasangan
dari empat kelompok ini, kita membutuhkan fungsi diskriminan Z 1 dan Z2 . Dalam kasus
ini, dibutuhkan lebih dari satu fungsi diskriminan untuk dapat secara cukup menyajikan
perbedaan-perbedaan di kalangan keempat kelompok ini. Kedua sumbu ini, yaitu fungsi
diskriminan Z1 dan Z2 tidak dibatasi, atau tidak harus orthogonal satu terhadap lainnya.
Satu-satunya yang dibutuhkan adalah kedua set skor diskriminan adalah tidak saling
berkorelasi.
Pada contoh tadi, terkait dengan reduksi data, tidak banyak yang kita peroleh; kita
dapat saja menggunakan kedua variable original, X1 dan X2 untuk tujuan-tujuan
menemukan perbedaan. Tetapi, misalkan konfigurasi spasial dari observasi-observasi
dalam keempat kelompok yang tersaji dalam Panel II pada Gambar 9.1 adalah sama,
misalnya dalam 20 dimensi ( p = 20). Untuk konfigurasi spasial seperti ini, sebagian
besar dari perbedaan-perbedaan diantara empat kelompok ini dapat direpresentasikan
dalam ruang discriminan berdimensi dua yang didefiniksikan oleh dua fungsi
diskriminan, yaitu Z1 dan Z2, berlainan dengan merepresentasikan perbedaan-
perbedaan dalam 20 dimensi. Tentu saja hal ini memberikan banyak penghematan
dalam merepresentasi data. Oleh karena banyaknya variable diskriminan biasanya
lebih besar dari banyaknya kelompok, sejumlah besar penghematan dapat diperoleh
dengan merepresentasikan perbedaan-perbedaan di kalangan kelompok dalam ruang
diskriminan berdimensi r , dimana r ≤ G−1.
9.1.2. Mengidentifikasi Sumbu-Sumbu Baru

Pandang data hipotesis yang disajikan dalam Table 9.1. Gambar 9.2 menyajikan plot
dari data. Misalkan Z1 merupakan sumbu baru yang membentuk sudut θ=46.115 0
dengan sumbu X1. Proyeksi dari titik-titik ke Z1 memberikan variable baru Z1. Table 9.2
menyajikan Sum of square total, Sum of squares between group, dan sum of squares
within group dan λ 1, rasio dari sum of squares between group dengan sum of squares
within group, untuk berbagai sudut antara Z1 dan X1. Gambar 9.3 menyajikan plot dari
λ 1 dan θ . Dari table dan dari gambar kita bisa melihat bahwa maximum dari λ 1 adalah
19.250 manakala θ=46.115 0 atau 226.1150 ( = 46.1150 + 1800). Persamaan untuk
memperoleh proyeksi dari titik-titik ke Z1 adalah:
Z1= cos 46.115 × X 1+ sin 46.1150× X 2
= 0.693× X 1+ 0.721× X 2 ……………………(9.1)
yang dapat digunakan untuk menghitung skor-skor diskriminan untuk setiap observasi.
Namun, perhatikan Gambar 9.2 bahwa Z1 tidak dapat membedakan antara kelompok 2
dan kelompok 3. Oleh karena itu kita harus mencari sumbu lainnya yang dapat
menemukan perbedaan diantara kedua kelompok ini. Fungsi diskriminan yang pertama
bertanggung jawab untuk perbedaan-perbedaan maximum diantara kelompok-
kelompok dan berkorespondensi dengan nilai maximum untuk , sehingga fungsi
diskriminan akan tentu berkorespondensi dengan nilai ekstrim λ lainnya. Dari table 9.2
dan Gambar 9.3 kita lihat bahwa titik ekstrim kedua yang berkorespondensi dengan
θ=136.1150, atau 316.1150, dan menghasilkan nilai λ 2=16.374 . Persamaan yang
memberikan proyeksi dari titik-titik ke Z2 adalah:
Z 2=cos 136.115× X 1 +sin 136.115× X 2 (9.2)
−.721 × X 1 +0.693 × X 2
Yang dapat digunakan untuk menghitung skor-skor diskriminan yang kedua untuk
setiap observasi. Perhatikan bahwa dalam kasus ini kedua sumbu Z1 dan Z2 adalah
orthogonal.Hal ini tidak harus demikian untuk data-data set lainnya. Artinya. Fungsi-
fungsi diskriminan tidak dibatasi untuk harus orthogonal satu terhadap lainnya.
Konstrain yang harus ada yaitu skor-skor diskriminan yang dihasilkan haruslah tidak
berkorelasi.
9.1.3. Klasifikasi
Seperti yang ditunjukkan pada bab 8, klasifikasi dapat dilihat sebagaipembagian dari
seluruh ruang diskriminan atau raung variable menjadi R 1, R2, …, RG yang terpisah dan
sepenuhnya. Tiap observasi diklasifikasikan kedalam kelompok yang di dalam daerah
itu observasi itu berada. Gambar 9.4 menyajikan empat daerah klasifikasi dalam ruang
variable (data original). Perhatikan bahwa diperlukan dua garis lurus untuk membagi
ruang berdimensi dua menjadi empat daerah. Garis-garis lurus dapat dipandang sebagai
cut off lines. Ada sejumlah criteria atau aturan yang dapat digunakan untuk
mengidentifikasi cutoff lines untuk memperoleh daerah-daerah klasifikasi. Aturan-
aturan ini adalah generalisasi-generalisasi dari aturan-aturan yang dibahas dalam bab 8
dan appendiks., dan dibahas secara detail di bagian apendiks di akhir bab ini.
Gambar 9.5 menyajikan empat daerah klasifikasi dalam ruang diskriminan. Sekali lagi,
dua cutoff lines diperlukan untuk membentuk empat daerah. Anmun, jika hanya ada
satu fungsi diskriminan yang diperlukan untuk secara cukupmenyajikan perbedaan-
perbedaan diantara empat kelompok maka plot ruang diskriminan akan merupakan
plot berdimensi satu, dan 3 titik (cut off values) akan diperlukan untuk membagi ruang
berdimensi satu menjadi empat daerah.
9.2. Pendekatan Analitis.

Tujuan-tujuan dan prosedur analisis diskriminan kelompok banyak hampir serupa
dengan yang ada pada analisis diskriminan dua kelompok. Pertama, suatu analisis
univariat dapat dilaksanakan untuk menentukan apakah tiap variable diskriminan
secara significan membedakan keempat kelompok. Ini dapat diperoleh suatu uji F
secara keseluruhan. Uji F keseluruhan akan significan jika mean dari paling sedikit satu
pasangan kelompok adalah berbeda secara significant.
Setelah mengidentifikasi variable – variable diskriminan, langkah berikutnya adalah

mengestimasi fungsi diskriminan. Misalkan fungsi diskriminan yang pertama adalah
Z1 =w11 X 1+ w12 X 2+ …+w 1 p X p
Dimana w ijadalah bobot dari variable ke j untuk fungsi diskriminan ke i. Bobot-bobot

dari fungsi diskriminan diestimasi sedemikian sehingga
SS between group dari Z 1

λ 1=
SS within group dari Z 1
bernilai maximum.
Misalkan fungsi diskriminan yang kedua adalah
Z 2=w21 X 1 +w 22 X 2 +…+ w2 p X p
Dimana w ijadalah bobot dari variable ke j untuk fungsi diskriminan ke i. Bobot-bobot

dari fungsi diskriminan diestimasi sedemikian sehingga
SS betwe en group dari Z 2

λ 2=
SS within group dari Z 2
bernilai maximum tetapi dengan ketentuan bahwa skor-skor diskriminan Z1 dan Z2

tidak berkorelasi. Prosedur ini diulangi sampai semua fungsi diskriminan yang mungkin
telah teridentifikasi. Ini jelas adalah suatu masalah optimisasi, yang dibahas di appendix
bab 8, solusinya adalah menemukan eigenvector-eigenvector dan eigenvalue-
eigenvalue dari matrix nonsymetric W B dimana W dan B berturut-turut adalah
−1
matrix SSCP within group dan between group dari p variable. Perhatikan bahwa
matrix W-1B adalah nonsymetric, eigenvector-eigenvector bisa tidak orthogonal. Artinya
fungsi-fungsi discriminant tiak akan orthogonal. Namun, skor-skor diskriminan yang
dihasilkan tidaklah berkorelasi.
Setelah fungsi-fungsi discriminant sudah diidentifikasi, langkah berikutnya adalah

menentukan suatu aturan untuk mengklasifikasi observasi-observasi berikutnya.
Prosedur klasifikasi dal MDA adalah generalisasi dari prosedur-prosedur yang dibahas
dalam kasus dua kelompok. Sebagaimana yang sudah dibahas sebelumnya, semua
prosedur klasifikasi termasuk pembagian ruang diskriminan, atau ruang variable,
kedalam daerah-daerah G yang eksklusif dan collectively exhausted. Sebagai contohnya,
untuk mengklasifikasi suatu observasi yang diketahui dengan menggunakan skor-skor
determinan, skor-skor diskriminan dihitung, kemudian observasi-observasi di plotkan
dalam ruang diskriminan. Observasi diklasifikasikan ke dalam suatu kelompok yang ada
dalam daerah itu. Beragam prosedur klasifikasi dibahas dalam pasal 9.3.3 dan di
appendix.
9.3. Penggunaan SPSS untuk MDA

Data yang disediakan dalam Table 9.1 digunakan untuk membahas output dari SPSS.
Table 9.3 memberikan perintah SPSS dan Exhibit 9.1 menyajikan hasil outputnya.
Banyak prosedur penghitungan terkait dengan berbagai uji statistic dibahas secara
detail dalam bab 8, dan kami menyarankan pembaca membaca pasal-pasal yang terkait
dalam bab 8.
9.3.1. Mengevaluasi significansi dari variable-variable.

Output menyajikan mean-mean dari variable-variable untuk sample total dan mean
untuk tiap kelompok, Wilks’ Λ , dan Rasio F univariat [1a, 1b]. Nilai Wilk’s Λ yang
ditransform akan mengikuti distribusi F secara persis hanya untuk kasus-kasus
tertentu saja (lihat Table 9.4). Dalam hal kasus lainnya, distribusi dari nilai Wilk’s Λ
hasil transfer hanya dapat diestimasi oleh distribusi F. Statistik F digunakan untuk
menguji hipotesis nol dan hipotesis alternative univariate untuk variable-variable
pembeda X1 dan X2 sebagai berikut:
H 0 : μ1=μ2=μ 3=μ4
H a : μ1 ≠ μ2 ≠ μ 3 ≠ μ4
dimana μ1 , μ 2 , μ3 dan μ 4 adalah mean-mean populasi untuk kelompok-kelompok 1, 2, 3,

dan 4. Hipotesis nol akan ditolak jika mean-mean dari paling sedikit satu pasang
kelompok adalah berbeda secara significant.Hipotesis nol untuk kedua variable dapat
ditolak pada level significansi 0.05. Artinya, paling sedikit satu pasang kelompok adalah
berbeda secara significant terkait mean-mean dari X1 dan X2. Suatu pembahasan
pasangan kelompok manakah yang berbeda disajikan pada pasal berikut ini.
9.3.2. Fungsi Discriminant

Pilihan-pilihan untuk menghitung fungsi diskriminan
Berbagai parameter control untuk mengestimasi fungsi-fungsi diskriminan disajikan
dalam pasal ini [2a]. Karena kita mempunyai empat kelompok untuk hanya dua
variable, maximum banyaknya fungsi diskriminan yang dapat diestimasi adalah dua.
Juga probability sebelumnya diasumsikan sama (yaitu mereka adalah .25 untuk tiap
kelompok). Artinya, probability bahwa suatu observasi yang termasuk pada salah satu
dari empat kelompok itu adalah sama.
Estimasi dari fungsi-fungsi diskriminan
Fungsi-fungsi diskriminan tak standar adalah [2e]:
Z1 =−9.418 +.584 X 1 +.608 X 2 (9.3)
Z 2=−0.360 +.560 X 1−.539 X 2 (9.4)
Sekali lagi, dengan mengabaikan konstanta, rasio – rasio dari koefisien-koefisien dalam
persamaan 9.3 dan 9.4, berturut-turut adalah sama dengan rasio-rasio yang dilaporkan
pada persamaan 9.1 dan 9.2. Perhatikan bahwa tanda-tanda untuk koefisien-koefisien
untuk fungsi-fungsi diskriminan yang ada pada persamaan 9.4 adalah lawan dari yang
disediakan pada persamaan 9.2. Hal ini tidak perlu dipedulikan, karena persamaan 9.2
dapat diperoleh dengan cara mengalikan persamaan 9.4 dengan negative satu.
Selanjutnya, perhatikan bahwa Gambar 9.2 S2 membentuk sudut 136.115 0 atau
316.1150 dengan sumbu X1. Jika ada yang mau menggunakan sudut 316.115 0 antara Z2
dan X1, maka dalam persamaan 9.2 akan diperoleh bobot-bobot dari X1 dan X2
berturut-turut adalah 0.721 dan -0.693., yang sekarang akan memiliki tanda yang sama
seperti bobot-bobot pada persamaan 9.4.
Berapa Banyak Fungsi Diskriminan?

Pertanyaan selanjutnya sudah jelas adalah: Ada berapa fungsi determinan yang bisa
ditemukan atau digunakan agar dapat merepresentasikan perbedaan-perbedaan
dikalangan kelompok-kelompok? Pertanyaan ini dapat dijawab dengan cara
mengevaluasi significansi statistic dan signifikansi praktis dari setiap fungsi
diskriminan. Artinya, apakah skor-skor diskriminan yang berkaitan dengan fungsi-
diskriminan memang berbeda diantara kelompok-kelompok?
SIGNIFIKANSI STATISTIK. Tidak semua dari K fungsi diskriminan itu adalah secara
statistic signifikan. Artinya hanya r ( dimana r≤ K ¿ fungsi diskriminan yang mungkin
perlu untuk merepresentasi paling banyak perbedaan-perbedaan di kalangan
kelompok-kelompok. Rumus berikut ini digunakan untuk menghitung nilai χ 2untuk
mengases signifikansi statistic secara keseluruhan dari semua fungsi-fungsi
diskriminan:
K
χ 2= [ n−1− ( p+ G ) /2 ] ∑ ln ( 1+ λk ) …. (9.5)
k=1
Dimana λ k adalah eigenvalue dari fungsi diskriminan ke k. Dengan menggunakan rumus

ini hasil dari χ 2 adalah
χ = [ 152−1−( 2+ 4 ) /2 ][ ln ( 1+19.24957 ) + ln ( 1+16.37504 ) ]

2
= 281.424.
yang sama dengan χ 2yang dilaporkan dalam output [2d]. Perhatikan bahwa nilai χ 2
yang baru diperoleh itu menggunakan eigenvalue-eigenvalue untuk semua K fungsi
diskriminan. Karena itu, nilai χ 2 yang dilaporkan pada baris pertama di outpu tidak
menguji signifikansi statistic dari fungsi pertama saja, tetapi secara bersama ia menguji
significansi statistic dari semua fungssi diskriminan yang mungkin. Suatu nilai χ 2 yang
significan secara statistic menyimpulkan bahwa paling sedikit fungsi diskriminan Iyang
pertamaadalah significan; fungsi-fungsi diskriminan lainnya bisa atau tidak significan.
Dalam kasus sekarang ini χ 2 yang = 281.432 adalah significan secara statistic,
menyarankan bahwa fungsi diskriminan yang pertama adalah significan secara statistic.
Significansi statistic dari fungsi diskriminan lainnya itu menentukan apakah secara
bersama mereka menjelaskan besarnya perbedaan diantara keempaat kelompok yang
belum dijelaskan oleh fungsi diskriminan pertama. Pengujian significansi statistic dapat
diselesaikan dengan menghitung nilai χ 2 dengan menggunakaan persamaan berikut ini:
K
χ 2= [ n−1− ( p+ G ) /2 ] ∑ ln ( 1+ λk ) …. (9.6)
k=2
Yang dalam kasus yang sekarang ini sama dengan
χ = [ 152−1−( 2+ 4 ) /2 ][ ln ( 1+16.37504 ) ]
2
= 137.040
Dan ini sama dengan yang dilaporkan dalam output [2d]. Perhatikan bahwa persamaan
9.6 dimodifikasi dari persamaan 9.5 dimana dalam perhitingannya dibuang eigenvalue
dari fungsi diskriminan yang pertama. Suatu nilai χ 2 yang significan akan
menyimpulkan bahwa fungsi diskriminan kedua dan mungkin saja fungis-fungsi
diskrimian berikutnya secara significan menjelaskan perbedaan-perbedaan dalam
kelompok-kelompok yang tidak dijelaskan oleh fungsi diskriminan pertama. Oleh
karena nilai χ 2 adalah 136.040 adalah significan secara statistic, kita simpulkan bahwa
paling sedikit fungsi diskriminan kedua juga menjelaskan sejumlah perbedaan yang
significan diantara keempat kelompok yang tidak dijelaskan oleh fungsi diskriminan
pertama.
Dalam hal dimana ada sebanyak K fungsi diskriminan, prosedur diatas tadi diulangi
sampai nilai χ 2 tidak lagi significan. Secara umum, untuk memeriksa significasnsi
statistic dari fungsi diskriminan ke r, rumus untuk menghitung nilai χ 2 adalah:
K
χ r =[ n−1−( p+G ) /2 ] ∑ ln ( 1+ λ k )
2
…. (9.7)
k=r
Dengan (p-r+1)(G-r) derajat kebebasan.
Kesimpulan yang diperoleh dari pengujian-pengujian significansi adalah bahwa

keempat kelompok adalah berbeda secara significan berdasarkan mean-mean dari skor-
skor diskriminan dari kedua fungsi diskriminan. Tetapi, pasangan kelompok –
pasangaan kelompok manakah yang berbeda? Pertanyaan ini dapat terjawab dengan
memeriksa mean-mean dari skor-skor diskriminan [2.g]. Perhatikan bahwa mean-mean
dari skor-skor diskriminan yang diperoleh dari fungsi pertama, Z1, terlihat berbeda
untuk semua pasangan kelompok, kecuali pasangan kelompok 2 dan 3; dan mean-mean
dari skor-skor diskriminaan yang diperoleh dari fungsi kedua, Z2, tidak berbeda untuk
kelompok 3 dan 4. Namun, tidak akan selalu mungkin untuk menentukan , untuk setiap
fungsi, pasangan-pasangaan manakah dari kelompok-kelompok yang berbeda secara
significan dengan secara visual memeriksa mean-mean. Agar secara formal kita
menentukan pasangan-pasangan manaa dari kelompok yang berbeda, kita harus
menetapkan uji-uji berpasangan, misalnya LSD (Least significant different), Tukey test,
uji Scheffe. Uji-uji ini tersedia dalam prosedur ONEWAY dalam SPSS. Berikut ini
disajikan pembahasan singkat tentang output dari procedur ONEWAY.
Table 9.5 menyajikan perintah-perintah SPSS. Perintah COMPUTE digunakan untuk

menghitung skor-skor diskriminan. Perhatikan bahwa fungsi-fungsi diskriminan yang
tidak standar digunakan untuk menghitung skor-skor diskriminan [2e]. Prosedur
ONEWAYmeminta suatu analisis variance untuk setiap variable dependent Z1 dan Z2.
Perintah bagian (sub command) RANGES= LSD (0.5) meminta pembandingan
berpasangan dari mean-mean dengan menggunakan uji LSD dan alfa pada level 0.05.
Uji-uji lainnya dapat diminta dengan cara secara spesifik menyebutkan nama uji itu.
Misalnya, uji Tukey dapat diminta dengan secara khusus RANGES=TUKEY. EXHIBIT 9.2
MENYAJIKAN SEBAGIAN OUTPUT.
Tabel Anova menyajikan rasio F untuk menguji hipotesis nol dan hipotesis alternative:
H 0 : μ1=μ2=μ 3=μ4
H a : μ1 ≠ μ2 ≠ μ 3 ≠ μ4
Rasio F keseluruhan untuk Z1 adalah 307.993 dan untuk Z2 adalah 262.001

menyarankan bahwa hipotesis nol dapat ditolak pada alpha = 0.05 [1 , 3 ]. Artinya,
paling sedikit ada satu pasangan kelompok berbeda secara significan berkaitan dengan
dua fungsi diskriminan. Kesimpulan ini tidak berbeda dari apa yang telah dicapai
sebelumnya. Informasi tambahan lainnya yang menarik yang diberikan dalam output
adalah untuk uji-uji pasangan [2, 4]. Tanda bintang menandakan pasangan-pasangan
mean manakah yang berbeda secara significan pada level alpha yang digunakan. Dapat
dilihat bahwa mean-mean Z1 adalah berbeda secara significan untuk semua pasangan
dari kelompok-kelompok terkecuali kelompok-kelompok 2 dan 3, dan mean-mean dari
Z2 adalah berbeda secara significan untuk semua pasang kelompok kecuali kelompok 1
dan 4 [4].
Significansi Praktis
Seperti biasanya, uji – uji significansi statistic sensitive terhadap ukuran sample.
Artinya, untuk sample berukuran besar suatu fungsi diskriminan diperhitungkan untuk
hanya perbedaankecil diantara kelompok-kelompok dapat saja berbeda secara
significan. Karena itu seseorang harus memperhitungkan signifikansi praktisdari suatu
fungsdi diskriminasi. Signifikansi praktis dari suatu fungsi diskriminan di ukur oleh
kuadrta korelasi kanonik (CR2) dan λ atau eigencalue-eigenvalue.
Seperti yang dibahas pada bab 8, suatu masalah analisis diskriminan dua kelompok
dapat diformulasikan sebagai suatu masalah korelasi kanonik dengan keanggotaan
kelompok (group membership) diberi kode dengan menggunakan variable – variable
dummy, sebagai variable – variable dependent. Dalam kasus ini, diperlukan tiga variable
dummy untuk member kode pada empat kelompok ini,yang menghasilkan tiga variable
dependen, dan analisis korelasi kanonik akan menghasilkan dua fungsi kanonik. Secara
berturut-turut, fungsi kanonik pertama dan kedua berkaitan dengan fungsi diskriminan
pertama dan kedua. Korelasi-korelasi kanonik adalah 0.975 dan 0.971 yang akan
menghasilkan CR2 berturut-turut 0.951 dan 0.943, untuk fungsi diskriminan pertama
dan kedua [2c, exibit 9.1]. Nilai CR2 yang tinggi mengindikasikan bahwa fungsi-fungsi
diskriminan memberikan perbedaan-perbedaan yang substansial diantara empat
kelompok.
Kita dapat juga menggunakan eigenvalue-eigenvalue (yaitu λ ¿ untuk mengukur

SS b
significansi praktis dari fungsi-fungsi diskriminan. Ingat bahwa λ= . Semakin besar
SS w
nilai λ untuk suatu fungsi diskriminan, semakin besarlah kemampuan fungsi
diskriminan itu untuk membedakan kelompok-kelompok. Oleh karena itu λ dari suatu
dapat juga digunakan sebagai suatu ukuraan darisignifikansi praktisnya. Pentingnya
atau kemampuan membedakan dari fungsi diskriminan ke j dapat diukur oleh ukuran,
persentasi variance, yang didefinisikan sebagai
λj
K
×100
∑ λj
j =1
Dimana K adalah banyak maximum fungsi diskriminan yang dapat diestimasi.

Perhatikan bahwa percent dari ukuran variance tidak merujuk pada variance dalam
data; namun, ia merepresentasikan persen dari perbedaan total diantara kelompok-
kelompok yang diperhitungkan oleh fungsi diskriminan. Percent dari variance untuk
dua fungsi diskriminan adalah sama dengan
19.250 16.375
× 100=54.03 ×100=45.97
19.250+16.375 19.250+ 16.375
Artinya, fungsi diskriminan yang pertama mempertimbangkan 54.03% dari perbedaan-

perbedaan yang mungkin diantara kelompok-kelompok dan yang fungsi diskriminan
yang kedua mempertimbangkan 45.97% dari perbedaan-perbedaan diantara
kelompok-kelompok [2c]. Secara bersama sama fungsi-fungsi diskriminan
mempertimbangkan 100% dari semua perbedaan yang mungkin diantara kelompok-
kelompok. Penegasan ini sekaligus didukung oleh tingginya nilai dari CR 2.
Tetapi, seberapa tinggi kah tinggi itu? Atau apakah nilai cutoffnya untuk menentukan
berapa banyak fungsi diskriminan yang harus digunakan? Persoalan ini serupa dengan
persoalan berapa banyakkah komponen utama yang harus dipertahankan dalam
analisis komponen utama dan analisis faktor? Orang dapat menggunakan scree plot
dimana sumbu X merepresentasikan byaknya fungsi diskriminan dan sumbu Y
merepresentasikan eigenvalue-eigenvalue. Dalam hal apapun, isu tentang berapa
banyak fungsi harus dipertahankan sesungguhnya merupakan suatu aspek judgement
dan bervariasi diantara para peneliti, dan dari situasi ke situasi lain.
Mengukur Pentingnya Variable-variable diskriminan dan

Arti dari Fungsi Diskriminan
Seperti yang dibahas dalam bab 8, koefisien-koefisien yang distandarkan dan loading-
loading dapat digunakan untuk mengukur seberapaa peentingnya variable-variable
dalam membentuk fungsi-fungsi diskriminan. Karena data adalah data hipotetis
( misalnya, kita tidak tahu X1 dan X2 itu mewakili apa) tidak mungkin untuk memberi
label yang bermakna pada fungsi – fungsi diskriminan. Penggunaan loading-loading
untuk memberikan makna pada fungsi-fungsi diskriminan akan dibahas pada pasal 9.4.
9.3.3. Klasifikasi
Ada beberapa aturan yang berbeda yang dapat digunakaan untuk mengklasifikasi
observasi-observasi yang akan dijumpai kelak. Aturan – aturan ini adalah generalisasi
dari aturan-aturan yang dibahas pada appendix di bab 8. Appendix pada bab ini
menyajikan pembahasan yang rinci tentang berbagai aturan untuk mengklasifikasikan
observasi-observasi ke dalam berbagai kelompok.
Fungsi-fungsi klasifikasi untuk setiap kelompok dilaporkan oleh SPSS [2b]. Untuk
mengklasifikasikan suatu observasi, pertama kali fungsi klasifikasi untuk masing-
masing kelompok digunakan untuk menghitung skor-skor klasifikasi dan observasi
ditempatkan pada kelompok yang memiliki skor klasifikasi tertinggi.
Probabilitas posterior dari suatu observasi yang berada dalam suatu kelompok dapat
juga dihitung. Suatu observasi ditempatkan pada kelompok dengan poobabilitas
posterior tertimggi. SPSS melaporkan dua probabilitas posterior tertinggi [2h].
Berdasarkan matrix klasifikasi semua observasi diklasifikasikan dengan benar [2i].
Significansi statitis dari laju klasifikasi (classification rate) dapat diukur dengan
menggunakan prosedur yang dijelakan di bab 8. Dengan menggunakan persamaan 8.20,
banyaknya klasifikasi yang diharapkan benar sesuai hanya dengan peluang (chance)
adalah 13, dan dari persamaan 8.18 itu Z* = 12.49, yang adalah significant pada p <.01.
Seperti yang diuraikan dalam pasal 9.1.3, klasifikasi itu sesungguhnya melibatkan
pembagian ruang diskriminan total menjadi daerah-daerah yang mutual exclusive dan
exhausted. Suatu plot yang memperlihatkan daerah-daerah ini dinamakan map
teritorial. SPSS manyajikan map teritorial [2f]. Dalam map ini sumbu-sumbu
merepresentasikan fungsi-fungsi diskriminan dan tanda-tanda bintang
merepresentasikan centoid-centroid dari kelompok-kelompok. Keempat daerah yang
mutually exclusive itu diberi tanda R1, R2, R3, dan R4. Untuk dapat mengklasifikasikan
suatu observasi, mula-mula dihitung skor diskriminannya dan di plot pada map
territorial. Observasi itu kemudian diklasifikasikan pada kelompok yang di daerah
kelompok itu dimana observasi tersebut ditempatkan. Misalnya, pandanglah suatu
observasi baru dengan nilai 3 dan 4, berturut-turut untuk X1 dan X2. Skor – skor
diskriminan Z1 dan Z2, berturut-turut adalah: (gunakan fungsi diskriminan 9.3 dan 9.4.
(lihat [2.e]
Z1 = - 9.418 + .584 ×3+ .608× 4=−5.234
Z2 = −.360+.560 ×3−.539 × 4=−.836
Dapat dilihat bahwa observasi ini berada di R1, dan oleh karena itu ia diklasifikasikan
pada kelompok 1.
9.4. Suatu Contoh Ilustrasi

Misalkan sorang manager merek di perusahan minuman bir tertarik untuk memperoleh
gagasan baru tentang perbedaan-perbedaan diantara merek-merek bir yang ternama,
sebagaimana yang dianggap di pasar. Pelanggan diminta untuk memberikan rating
pada empat merek bir utama dengan menggunakan skala semantic
Heavy - - - - - Light
Mellow - - - - - Not Mellow
Not Filling - - - - - Filling
No Aftertaste - - - - - Aftertaste
Foamy - - - - - Not Foamy
Data diberikan kode sedemikian sehingga angka-angka yang lebih tinggi menunjukkan
kesan positif. Misalnya, Heavy diberi kode 1 dan Light diberi kode 5; Good Flavor diberi
kode 5 dan Bad Flavor diberi kode 1.
Table 9.6 manyajikan perintah-perintah SPSS. Perintah FUNCTIONS digunakan untuk

menetapkan banyaknya fungsi yang harus dipertahankan. Opsi pertama
memberikanjumlah maximum dari fungsi-fungsi yang dapat dipertahankan, pilihan
kedua menyatakan persentasi maximum variance yang dapat diandalkan, dan opsi
ketiga menyajika p –value dari fungsi-fungsi yang dipertahankan. Dalam kasus yang
sedang dihadapi sekarang ini, dari tiga fungsi yang mungkin yang diandalkan untuk
menghasilkan 100% perbedaan-perbedaan, hanyalah fungsi-fungsi yang significans
secara statistic pada alpha = 0.05 yang dipertahankan. Perintah ROTATE menyatakan
bahwa matrx STRUCTURE harus dirotasi. Exhibit 9.3 ,menyajikan bagian-bagian yang
relevan dengan out put analisis diskriminan. Wilk’s Λ dan rasio F univariate
menunjukkan bahwa mean-mean dari semua atribut adalah berbeda diantara ke empat
merek, kecuali atribut ke enam ( Foamy dan Not Foamy). Namun, manager
berkeinginan untuk memasukkan keenam variable untuk menghitung fungsi-fungsi
diskriminan yang bersesuaian. Dari tiga fungsi diskriminan yang mungkin, hanya dua
yang pertama yang significan secara statistic dan berperan (diperhitungkan) bagi
semua kemungkinan perbedaan diaantara empat merek ( lebih dari 95%).[2]
Output juga menyajikan skor diskriminan rata-rata untuk empat kelompok [6]. Ini
diperoleh dengan mensubstitusikan centoid-centoid kelompok atau mean-mean
kelompok dalamfungsi diskriminan tidak standar. Exhibit 9.4. menyajikan output yang
relevan dari prosedur ONEWAY untuk menguji pasangan dari kelompok-kelompok
(yaitu merek-merek) manakah yang berbeda berdasarkan dua fungsi diskriminan.
Dapat dilihat bahwa berdasarkan fungsi diskriminan pertama, kelompok – kelompok 1,
2 dan 4 (merek A, B dan D) tidak berbeda secara significan dari kelompok 3 (merek C).
Kelompok-kelompok 1 dan 2 (merek A dan B) dan kelompok 2 dan 3 (merek B dan C)
tidak berbeda seacara significan berkaitan dengan fungsi diskriminan kedua. Pertanyaa
berikut yang sudah pasti adalah: Dalam hal apakah merek – merek ini berbeda atau
serupa? Pertanyaan ini dapat dijawab dengan cara memberi label-label pada fungsi –
fungsi diskriminan. Sebagaimana yang dibahas nanti dalam pasal berikut ini, loading-
loading dapat digunakan untuk memberi label kepada fungsi-fungsi diskriminan dan
memplot atribut-atribut dalam ruang diskriminan.
9.4.1. Memberi Label pada Fungsi-fungsi Diskriminan

Matrix structur memberikan korelasi-korelasi sederhana diantara atribut-atribut dan
skor-skor diskriminan [3, exibit 9.3]. Semakin tinggi loading untuk suatu atribut pada
suatu fungsi,akan semakin representative suatu fungsi dari atribut itu. Naumun, sama
seperti kasus pada analisis factor, matrix structur dapat dirotasikan untuk memperoleh
struktur sederhana. Hanya rotasi varimax saja yang tersedia dalam prosedur analisis
diskriminan. Seperti yang dibahas dalam bab 5, rotasi varimax mencoba untuk
memperoleh loading-loading sedemikian sehingga setiap variable berperan terutama
pada hanya satu fungsi diskriminan. Berdasarkan rotated loading [4], Flavor dan Taste
mempunyai loading tinggi pada fungsi diskriminan pertama dan karena itu fungsi ini
diberi label “Quality” untuk merepresentasi kualitas bir. Filling dan Light mempunyai
load lebih tinggi di fungsi diskriminan kedua karena itu diberi label “ Lightness” untuk
merepresentasikan berat ringannya bir. Atribut Mellow mempunyai load yang sama
pada kedua fungsi, menyimpulkan bahwa kematangan dari suatu bir bisa
menyimpulkan tentang kualitas dan ringan/beratnya rasa bir. Atribut Foaminess tidak
mempunyai load yang tinggi pada fungsi apapun, dank arena itu, tidak terlalu penting
untuk member label kepada fungsi-fungsi. Harus diperhatikan bahwa berdasarkan
rasio F univariate mean dari atribut ini tidak berbeda secara significan diantara
keempat merek bir ini. Perhatikan juga bahwa loading terotasi [4] adalah cukup
berbeda dari loading yang ta terotasi. [3].
9.4.2 Memeriksa Perbedaan-Perbedaan dalam Merek
Dalam banyak aplikasi, MDA paling banyak digunakan untuk memeriksa perbedaan-
perbedaan diantara kelompok-kelompok, dan tidak untuk mengklasifikasi observasi-
observasi yang akan dijumpai kelak. Juga, hampir semua aplikasi MDA, perbedaan-
perbedaan kelompok biasanya dijelaskan oleh dua fungsi diskriminan. Akibatnya, kita
dapat mem plot centroid-centroid dari masing-masing kelompok [6] untuk
menyediakan tinjauan lanjut tentang perbedaan-perbedaan kelompok. Plot seperti ini
dinamakan suatu perceptual map. Suatu perceptual map memberikan suatu
representasi visual tentang perbedaan-perbedaan diantara kelompok-kelompok sesuai
dengan dimensi-dimensi kunci (yaitu fungsi-fungsi diskriminan).
Suatu plot dari centroid-centroid dari kelompok-kelompok ditunjukkan pada gambar

9.6. Sebelumnya sudah disimpulkan bahwa merek-merek A, B dan D tidak berbeda
berdasarkan kualitas (yaitu, fungsi diskriminan yang pertama), dan merek-merek A dan
B,dan merek B dan C tidak berbeda berdasarkan ringan/beratnya bir ( yaitu, fungsi
diskriminan kedua). Ini mengarah pada kesimpulan-kesimpulan berikut ini:
1. Merek A dan B tidak berbeda satu dengan lainnya berdasarkan ringat/berat bir
dan kualitas, tetapi mereka berbeda dari merek-merek lain. Artinya, pelanggan
memandang merek A dan B sebagai merek yang ringan, berkualitas tinggi dan
memandang mereka memang berbeda dari merek lainnya.
2. Merek D dipandang bir yang berkualitas dan tidak ringan
3. Merek C dipandang sebagai bir yang berkualitas paling rendah.
Kita juga dapat memplot atribut-atribut dalam perceptual map. Loading-loading

sesungguhnya adalah koordinat-koordinat dari atribut-atribut berdasarkan fungsi-
fungsi discriminan. Akibatnya, mereka dapat direpresentasikan sebagai vector-vector
dalam ruang diskriminan. Gambar 9.7 memberikan plotnya. Plot ini dapat digunakan
untuk menentukan rating atau ranking dari tiap merek bir pada setiap atribut. Ini dapat
dilakukan dengan membuat garis tegaklurus dari stimulus (yaitu brand) ke atribut-
atribut. Sebagai contoh, ranking-ranking dari merek-merek berdasarkan attribute
Aftercase adalah merek A, B , C dan D.

Multiple Group DA

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Multiple Group DA

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB 9.

Multiple Group Discriminant Analysis

9.1. Pandangan Geometris dari MDA

9.2.1. Berapa banyak fungsi diskriminan yang diperlukan?

9.1.2. Mengidentifikasi Sumbu-Sumbu Baru

Z1= cos 46.115 × X 1+ sin 46.1150× X 2

= 0.693× X 1+ 0.721× X 2 ……………………(9.1)

Z 2=cos 136.115× X 1 +sin 136.115× X 2 (9.2)

9.2. Pendekatan Analitis.

Setelah mengidentifikasi variable – variable diskriminan, langkah berikutnya adalah

Z1 =w11 X 1+ w12 X 2+ …+w 1 p X p

Dimana w ijadalah bobot dari variable ke j untuk fungsi diskriminan ke i. Bobot-bobot

SS between group dari Z 1

Misalkan fungsi diskriminan yang kedua adalah

Dimana w ijadalah bobot dari variable ke j untuk fungsi diskriminan ke i. Bobot-bobot

SS betwe en group dari Z 2

bernilai maximum tetapi dengan ketentuan bahwa skor-skor diskriminan Z1 dan Z2

Setelah fungsi-fungsi discriminant sudah diidentifikasi, langkah berikutnya adalah

9.3. Penggunaan SPSS untuk MDA

9.3.1. Mengevaluasi significansi dari variable-variable.

dimana μ1 , μ 2 , μ3 dan μ 4 adalah mean-mean populasi untuk kelompok-kelompok 1, 2, 3,

9.3.2. Fungsi Discriminant

Z1 =−9.418 +.584 X 1 +.608 X 2 (9.3)

Z 2=−0.360 +.560 X 1−.539 X 2 (9.4)

Berapa Banyak Fungsi Diskriminan?

Dimana λ k adalah eigenvalue dari fungsi diskriminan ke k. Dengan menggunakan rumus

χ = [ 152−1−( 2+ 4 ) /2 ][ ln ( 1+19.24957 ) + ln ( 1+16.37504 ) ]

Yang dalam kasus yang sekarang ini sama dengan

Dengan (p-r+1)(G-r) derajat kebebasan.

Kesimpulan yang diperoleh dari pengujian-pengujian significansi adalah bahwa

Table 9.5 menyajikan perintah-perintah SPSS. Perintah COMPUTE digunakan untuk

Rasio F keseluruhan untuk Z1 adalah 307.993 dan untuk Z2 adalah 262.001

Kita dapat juga menggunakan eigenvalue-eigenvalue (yaitu λ ¿ untuk mengukur

Dimana K adalah banyak maximum fungsi diskriminan yang dapat diestimasi.

Artinya, fungsi diskriminan yang pertama mempertimbangkan 54.03% dari perbedaan-

Mengukur Pentingnya Variable-variable diskriminan dan

Z1 = - 9.418 + .584 ×3+ .608× 4=−5.234

Z2 = −.360+.560 ×3−.539 × 4=−.836

9.4. Suatu Contoh Ilustrasi

Mellow - - - - - Not Mellow

Not Filling - - - - - Filling

Foamy - - - - - Not Foamy

Table 9.6 manyajikan perintah-perintah SPSS. Perintah FUNCTIONS digunakan untuk

9.4.1. Memberi Label pada Fungsi-fungsi Diskriminan

Suatu plot dari centroid-centroid dari kelompok-kelompok ditunjukkan pada gambar

Kita juga dapat memplot atribut-atribut dalam perceptual map. Loading-loading

Anda mungkin juga menyukai