Menurut Malhotra (2006), analisis diskriminan terdiri dari lima tahap, yaitu:
(1) merumuskan masalah, (2) mengestimasi koefisien fungsi diskriminan, (3)
memastikan signifikansi determinan, (4) menginter-pretasi hasil dan (5) menguji
signifikansi analisis diskriminan.
Saat ini analisis diskriminan sangat mudah dilakukan karena banyaknya software
pendukung. Namun, karena software akan melakukan tugasnya begitu data
dimasukkan, perlu dipastikan terlebih dahulu bahwa instrumen yang digunakan
akurat (baik secara teori maupun statistik) dan datanya reliabel. Sebab, pameo
“Garbage in garbage out”, belaku juga untuk analisis diskriminan.
Jangan terlalu kaku dalam menetapkan batas antar kategori, sebab kita harus
melihat proposi setiap kategori. Kalau tidak proporsional, misalnya satu
kategori berisikan 98% sedangkan kategori lain hanya 2% dari total objek, maka
batas kategori (cut-off) dapat digeser, sampai ditemukan jumlah objek yang
proporsional pada setiap kategori yang dibentuk. Pemilihan variabel prediktor
pun harus didasarkan pada teori ataupun riset sebelumnya.
Tahap selanjutnya adalah membagi sampel ke dalam dua bagian. Satu bagian
berfungsi sebagai sampel estimasi atau sampel analisis. Sesuai dengan namanya,
sampel ini dipakai untuk mengestimasi fungsi diskriminan.
Satu bagian lagi disebut holdout atau sampel validasi (validation sampel),
disimpan untuk mem-validasi fungsi diskri-minan. Kalau jumlah sampel besar,
maka sampel dapat dibagi dua, setengahnya sebagai sampel analisis, setengahnya
lagi sampel validasi.
Ada baiknya memperhatikan distribusi dalam sampel total. Seandainya sampel
total berisikan 30% responden yang loyal dan 70% responden yang tidak loyal,
maka setelah pembagian, diharapkan ditemukan pula distribusi yang sama pada
sampel analisis (30% responden loyal dan 70% responden tidak loyal) dan sampel
validasi (30% responden loyal dan 70% responden tidak loyal.
Para dosen yang memakai dana Litbang diberi kode 1 dan yang memakai dana
sendiri diberi kode 2. Distribusi kedua bagian dalam hal penelitian sendiri
dan penelitian lewat Litbang, pada kedua sampel dapat dikatakan berimbang.
Estimasi dapat dilakukan setelah sampel analisis diperoleh. Ada dua pendekatan
umum yang tersedia. Pertama, metoda langsung (direct method), yaitu suatu cara
mengestimasi fungsi diskriminan dengan melibatkan variabel-variabel prediktor
sekaligus. Setiap variabel dimasukkan tanpa memperhatikan kekuatan diskriminan
masing-masing variabel. Metoda ini baik kalau variabel-variabel prediktor dapat
diterima secara teoritis.
Kedua, stepwise method. Dalam metoda ini, variabel prediktor dimasukkan secara
bertahap, tergantung pada kemampuannya melakukan diskriminasi grup. Metoda ini
cocok kalau peneliti ingin memilih sejumlah variabel prediktor untuk membentuk
fungsi diskriminan.
1. Buka program SPSS. Lalu, pada layar, isikan data Tabel 6-1. Lakukan
penyesuaian nama variabel dan angka desimal melalui menu View, seperti tampak
di layar (hanya sebagian layar ditampilkan di sini).
4. Dari kotak dialog Discriminant analysis, klik Save, kemudian pada kotak
dialog save yang muncul sesudahnya, pilih fasilitas-fasilitas seperti ditandai
di bawah ini. Dengan fasilitas-fasilitas tersebut, SPSS akan memprediksi
keanggotaan setiap responden, skor diskriminan responden, serta peluang
keanggotaan responden pada grup 1 dan grup 2 (Hasilnya pada Tabel 6-1 di atas).
5. Terakhir, pada kotak dialog discriminant analysis, klik OK, kemudian
didapatlah hasil seperti pada Tabel 6-3.
INTERPRETASI OUTPUT
Standar deviasi juga merupakan indikator apakah variabel berperan baik sebagai
diskriminator ataukah tidak. Sangat baik kalau standar deviasi dalam grup
lebih rendah dari standar deviasi total, sebab dalam grup tentu nilai variabel
lebih homogen. Pada Output 1, semua variabel memenuhi syarat ini, kecuali
variabel gaji, di mana standar deviasi gaji (variabel X1) grup 2 lebih tinggi
dibanding standar deviasi total. Memang, terbukti kemudian dari standardized
coefficient dan structure matrix, peran variabel ini dalam mendiskriminasi
objek paling rendah.
Untuk contoh ini, nilai Box’s M adalah 10.892 dengan nilai sig.=0.515. Dengan
demikian tidak cukup bukti untuk menolak Ho. Jadi, matrik kovarian kedua grup
adalah sama. Dengan demikian, dari kriteria ini, analisis diskriminan dapat
dilakukan.
Pada Output 2, dengan µ=0,05, maka nilai signifikansi nilai F menunjukkan
bahwa ketika diperiksa secara sendiri-sendiri, semua variabel prediktor
signifikan (karena nilai signifikansinya di bawah 0,05). Hipothesis yang diuji
adalah:
H0: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah
sama.
Ha: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah
tidak sama.
Dengan nilai sig. semua variabel di bawah 0.05, punya cukup bukti untuk menolak
H0 dan menyatakan bahwa memang rata-rata variabel pada kedua grup diskriminan
yang terbentuk adalah berbeda.
Karena hanya dua grup yang dibentuk, maka fungsi diskriminan hanya ada satu,
dengan eigenvalue sebesar 2,993 yang sudah mencakup 100 % varians yang
dijelaskan (explained variance).
Uji Signifikansi
H0: Rata-rata semua variabel dalam semua grup (dalam contoh ini dua grup)
adalah sama.
Nilai Wilk’s lambda ditransformasi menjadi nilai chi-square. Pada hasil Output
4 terlihat bahwa Wilks’ λ berasosiasi sebesar 0,250 dengan fungsi diskriminan.
Angka ini kemudian ditransformasi menjadi chi-quare dengan derajat kebebasan
(ditulis df, singkatan dari degree of freedom) sebesar 4. Nilai chi-square
adalah dengan nilai 36,001. Kesimpulannya, cukup bukti untuk menolak H0 dengan
tingkat kesalahan (atau µ)=0,000. Dengan demikian kita dapat menyimpulkan
bahwa fungsi memiliki kemampuan melakukan diskriminasi.
Kedua, peneliti juga bisa menggunakan structure matrix, yang juga disebut
canonical loadings dan discriminant loadings. Jangan perhatikan negatif atau
positifnya. Perhatikan nilai mutlaknya. Pada Output 6, dengan structure
matrix, kita dapat menyimpulkan bahwa peran diskriminasi dari yang tertinggi
sampai terendah adalah kemampuan peneliti, daya tarik topik, sikap terhadap
litbang dan gaji dosen.
Ketiga, kita dapat menggunakan nilai F per prediktor (Output 2), yang disebut
univariate F ratio. Semakin besar nilai F, kontribusi terhadap diskriminasi
semakin tinggi.
Fungsi Diskriminan
Dengan program SPSS sebenarnya kita tidak perlu lagi menghitung skor
diskriminan (disebut juga Z scores) karena sudah disediakan oleh SPSS. Akan
tetapi, untuk meningkatkan pemahaman, kita perlu mengetahui dari mana datangnya
skor-skor itu. Persamaan di bawah ini, yang menggunakan koefisien dari Output
7, dapat dipakai menghitung skor diskriminan dengan presisi tinggi.
Sekiranya kita menggunakan skor diskriminan yang telah diberikan oleh program
komputer, maka persamaan pertama tidak bermasalah. Persamaan ini baru
bermasalah kalau kita menghitung skor diskriminan secara manual, sebab angkanya
bisa berbeda (walaupun tidak banyak) dengan skor diskriminan yang diberikan
komputer. Lihat pengerjaan manual di bawah ini.
Canonical Discriminant
Function Coefficients
Function
1
GAJI -0.028541
KMAMPUAN 0.548800
SIKAP 0.674008
DAYATAR 0.802052
(Constant) -10.124622
Unstandardized coefficients
D=-10.126-0,029(3.2)+0,674(5)+0.549(6)+0.802(7)=2.3708
Validasi
Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan
optimum cutting score. Memang dari komputer, informasi ini sudah diperoleh.
Akan tetapi, tak ada salahnya kalau kita mengetahui cara mengerjakannya secara
manual.
Rumus yang digunakan berbeda untuk grup yang proporsional (kedua grup mempunyai
jumlah anggota yang sama) dan yang tidak proporsional (jumlah anggota kedua
grup berbeda).
Untuk dua grup yang mempunyai ukuran yang sama (seperti sampel holdout Tabel
6-2), cutting score dinyatakan oleh rumus:
di mana
ZA = Centroid grup A
ZB = Centroid grup B
Jadi, pembatasnya adalah 0,000. Kalau di atas 0,000 masuk grup 1 dan kalau di
bawah 0,000 masuk grup 2. Oleh karena itu, responden 1 pada sampel holdout,
dengan skor diskriminan 2,28368. Responden 11, dengan skor diskriminan
-3,15108, masuk grup 2. Dengan skor-skor yang ada, sekarang prediksilah setiap
responden.
Apabila dua grup berbeda ukuran, seperti sampel analisis, maka rumus cutting
score yang digunakan adalah:
Di mana,
ZA = Centroid grup A
ZB = Centroid grup B
Tanpa cutting score pun, sebenarnya kita dapat langsung memprediksi grup setiap
responden, yaitu dengan melihat paling dekat ke centroid mana skor diskriminan
masing-masing objek. Misalnya, skor diskriman responden 1 sampel analisis,
yang sebesar 2.18646, tentunya lebih dekat ke 1.787 (centroid grup 1) daripada
ke -1,564 (centroid grup 2). Oleh karena itu diprediksi masuk ke grup 1.
Responden 15 sampel analisis, dengan skor diskriminan -0,27107, tentunya masuk
grup 2.
Program SPSS juga memberikan peluang masuk grup 1 dan grup 2. Peluang ke grup
mana paling besar dimiliki suatu objek, ke grup itulah objek tersebut kita
prediksi. Responden 1 sampel analisis, misalnya, memiliki peluang ke grup 1
sebesar 0,99904 dan ke grup 2 sebesar 0,00096. Tentunya, peluang ke grup 1
lebih besar, jadi ke grup itulah responden 1 diprediksi.
Hit ratio
Hit rasio adalah persentase kasus atau responden yang kelompoknya dapat
dipreksi secara tepat. Kalau jumlah seluruh kasus sampel analisis (atau
responden) adalah 30 (pada kedua grup), lalu fungsi diskiminan dapat
memprediksi 29 kasus secara tepat (hanya responden 3 yang error), maka hit
ratio adalah 29/30=96,67%. Tanpa menggunakan kriteria apa pun, karena mampu
memprediksi grup keanggotaan 29 responden dari total 30 responden dan hanya
satu yang salah prediksi, kita dapat menilai angka ini sangat bagus.
Untuk sampel holdout, fungsi diskriminan mampu memprediksi keanggotaan semua
(100%) objek. Karena itu, tanpa kriteria statistik apa pun, dapatlah kita
yakin bahwa fungsi diskriminan, baik sampel analisis maupun holdout, memiliki
keakuran yang tinggi.
Pertanyaannya, bagaimana kalau hit rasio tidak sebaik itu? Misalnya 60%,
apakah dapat diterima?
Kalau ukuran setiap grup sama, lihat nilai kesempatan klasifikasi. Menurut
Maholtra (2006), kesempatan klasifikasi untuk grup berukuran sama adalah 1
dibagi jumlah grup. Untuk sampel yang terdiri dari 2 grup, maka kesempatan
klasifikasi adalah ½ atau 0,50.
Hair et. al. (2006) menyatakan bahwa kriteria hit ratio yang baik adalah kalau
sama atau melebihi kesempatan klasifikasi ditambah seperempatnya. Kalau
kesempatan klasifikasi adalah 50%, maka batas minimal hit rasio adalah 0,50 +
(0,25) (0,50)=0,625 atau 62,5%.
Kalau kita memiliki 4 grup, maka kesempatan klasifikasi adalah 25%. Dengan cara
yang sama, batas minimal hit ratio adalah 31,25%.
Untuk sampel holdout kriteria ini dapat digunakan. Sayangnya, dua grup dalam
sampel analisis tidak sama ukurannya. Kriteria kesempatan proporsional
(proportional chance ciriterion) dapat dipakai kalau ukuran grup-grup tidak
sama dan kalau tujuan peneliti adalah menentukan secara tepat keanggotaan objek
pada dua (atau lebih) grup. Rumusnya adalah
CPRO=p2+(1-p2)
Di mana:
Untuk sampel analisis, proporsi grup 1 adalah 46,67% dan proporsi grup 2 adalah
53,33%. Dengan kedua proporsi ini, maka kita dapat menghitung
CPRO=(0, 4667)2+(0,5333)2=0,5022=50,22%
Akurasi statistik.
Kita dapat menguji secara statistik apakah klasifikasi yang kita lakukan
(dengan menggunakan fungsi diskriminan) akurat atau tidak. Uji statistik yang
digunakan dinamakan Press’s Q Statistic. Ukuran sederhana ini membandingkan
jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah
grup. Nilai yang diperoleh dari perhitungan kemudian dibandingkan dengan nilai
kritis (critical value) yang diambil dari table Chi-Square dengan derajat
kebebasan satu (ditulis dk=1 atau df=1 atau v=1) dan tingkat keyakinan sesuai
keinginan kita. Statistik Q ditulis dengan rumus:
di mana
K = jumlah grup
Dengan µ=0,05 dan df=1, nilai X2 tabel adalah 3,841. Dengan demikian, dapat
kita simpulkan bahwa fungsi diskriminan kita akurat.