Anda di halaman 1dari 16

Melakukan Analisis Diskriminan

Menurut Malhotra (2006), analisis diskriminan terdiri dari lima tahap, yaitu:
(1) merumuskan masalah, (2) mengestimasi koefisien fungsi diskriminan, (3)
memastikan signifikansi determinan, (4) menginter-pretasi hasil dan (5) menguji
signifikansi analisis diskriminan.

Tahap 1: Merumuskan Masalah.

Tahap ini mencakup jawaban atas pertanyaan: “Kenapa analisis diskriminan


dilakukan (latarbelakang masalah) dan apa tujuan analisis diskriminan, termasuk
variabel-variabel apa yang dilibatkan? Kalau analisis diskriminan dipakai
sebagai alat analisis dalam sebuah penelitian formal (skripsi dan thesis),
tahap pertama, kedua dan ketiga dijelaskan pada metodologi penelitian.

Saat ini analisis diskriminan sangat mudah dilakukan karena banyaknya software
pendukung. Namun, karena software akan melakukan tugasnya begitu data
dimasukkan, perlu dipastikan terlebih dahulu bahwa instrumen yang digunakan
akurat (baik secara teori maupun statistik) dan datanya reliabel. Sebab, pameo
“Garbage in garbage out”, belaku juga untuk analisis diskriminan.

Pada tahap ini peneliti juga mengidentifikasi sasaran, variabel dependen


(disebut juga criterion variable), serta variabel independen. Variabel
dependen harus berisikan dua atau lebih kategori, di mana antara satu kategori
dengan kategori lain bersifat terpisah (mutually exclusive). Sekiranya
variabel dependen memakai skala metrik (interval ataupun rasio), skala variabel
dependen tersebut harus dirubah menjadi kategori terlebih dahulu. Misalnya,
sikap yang kita ukur dengan skala numeric berskala 1 sampai tujuh, dapat
dirubah menjadi dua kategori (comfortable dan uncomfortable) atau tiga kategori
(comfortable, neutral dan uncomfortable) atau lainnya.

Jangan terlalu kaku dalam menetapkan batas antar kategori, sebab kita harus
melihat proposi setiap kategori. Kalau tidak proporsional, misalnya satu
kategori berisikan 98% sedangkan kategori lain hanya 2% dari total objek, maka
batas kategori (cut-off) dapat digeser, sampai ditemukan jumlah objek yang
proporsional pada setiap kategori yang dibentuk. Pemilihan variabel prediktor
pun harus didasarkan pada teori ataupun riset sebelumnya.

Tahap selanjutnya adalah membagi sampel ke dalam dua bagian. Satu bagian
berfungsi sebagai sampel estimasi atau sampel analisis. Sesuai dengan namanya,
sampel ini dipakai untuk mengestimasi fungsi diskriminan.

Satu bagian lagi disebut holdout atau sampel validasi (validation sampel),
disimpan untuk mem-validasi fungsi diskri-minan. Kalau jumlah sampel besar,
maka sampel dapat dibagi dua, setengahnya sebagai sampel analisis, setengahnya
lagi sampel validasi.
Ada baiknya memperhatikan distribusi dalam sampel total. Seandainya sampel
total berisikan 30% responden yang loyal dan 70% responden yang tidak loyal,
maka setelah pembagian, diharapkan ditemukan pula distribusi yang sama pada
sampel analisis (30% responden loyal dan 70% responden tidak loyal) dan sampel
validasi (30% responden loyal dan 70% responden tidak loyal.

Validasi fungsi diskriminan perlu dilakukan berulang-ulang. Setiap kali,


sampel perlu displit ke dalam bagian analisis dan validasi. Fungsi diskriminan
perlu diestimasi, kemudian validasi dilakukan. Jadi, keakuratan fungsi
didasarkan pada sejumlah percobaan.

Contohnya, kita ingin kita ingin mempelajari faktor-faktor apa yang


mempengaruhi para dosen dalam memilih jalur penelitian dalam sebuah perguruan
tinggi: lewat lembaga Litbang dan penelitian sendiri. Ukuran sampel 50
orang. Dari jumlah itu, sebanyak 30 dosen dijadikan sampel analisis (Tabel
6-1). Sisanya, 20 dosen, dijadikan sebagai sampel validasi.

Para dosen yang memakai dana Litbang diberi kode 1 dan yang memakai dana
sendiri diberi kode 2. Distribusi kedua bagian dalam hal penelitian sendiri
dan penelitian lewat Litbang, pada kedua sampel dapat dikatakan berimbang.

Tahap 2: Mengestimasi Fungsi Diskriminan

Estimasi dapat dilakukan setelah sampel analisis diperoleh. Ada dua pendekatan
umum yang tersedia. Pertama, metoda langsung (direct method), yaitu suatu cara
mengestimasi fungsi diskriminan dengan melibatkan variabel-variabel prediktor
sekaligus. Setiap variabel dimasukkan tanpa memperhatikan kekuatan diskriminan
masing-masing variabel. Metoda ini baik kalau variabel-variabel prediktor dapat
diterima secara teoritis.

Kedua, stepwise method. Dalam metoda ini, variabel prediktor dimasukkan secara
bertahap, tergantung pada kemampuannya melakukan diskriminasi grup. Metoda ini
cocok kalau peneliti ingin memilih sejumlah variabel prediktor untuk membentuk
fungsi diskriminan.

Kasus 5. Dosen-dosen Universitas Internasional, sebuah perguruan tinggi


swasta, diwajibkan untuk melakukan penelitian (riset) ilmiah minimal sekali
setahun. Untuk membantu dosen-dosen melakukan riset, perguruan tinggi itu
menyediakan dana yang dapat diperoleh setelah proposal penelitian para dosen
dianggap layak oleh lembaga penelitian dan pengembangan (litbang) perguruan
tinggi itu. Para dosen yang merasa mampu juga dapat melakukan penelitian tanpa
harus melalui lembaga litbang.

Ternyata, sekalipun Universitas Internasional menyediakan dana penelitian,


lebih banyak dosen yang melakukan penelitian dengan biaya sendiri.

Untuk mengetahui penyebab kenyataan ini, dilakukan penelitian terhadap 50 dosen


yang melakukan penelitian, 24 di antaranya lewat litbang, 26 menggunakan biaya
sendiri. Empat variabel yang dijadikan sebagai variabel independen adalah gaji
(X1), sikap terhadap litbang (X2), kemampuan melakukan riset (X3), dan daya
tarik topik (attractiveness) yang diteliti (X4).

Sampel dibagi dua. Sebanyak 30 responden dipakai sebagai sampel analisis


(Tabel 6-1), datanya dapat diambil dari link ini. Sisanya, 20 responden,
dijadikan sebagai sampel holdout (Tabel 6-2).

Tabel 6-1. Sampel Analisis

Peluang ke Peluang ke Pre-dicted


Resp. Jalur X1 X2 X3 X4 Z Scores
Grup 1 Grup 2 Group
1 1 3.2 5 6 7 2.18646 0.99904 0.00096 1
2 1 4 6 5 5 0.43431 0.74667 0.25333 1
3 1 5.2 5 5 5 -0.14874 0.29473 0.70527 2
4 1 4 7 6 5 1.65712 0.99439 0.00561 1
5 1 2.7 6 5 6 1.27347 0.98001 0.01999 1
6 1 3.5 5 7 6 2.04985 0.99849 0.00151 1
7 1 4 6 5 7 2.03841 0.99843 0.00157 1
8 1 5 6 7 6 2.55584 0.99972 0.00028 1
9 1 4 5 7 6 2.03558 0.99842 0.00158 1
10 1 3.1 5 6 5 0.58521 0.83012 0.16988 1
11 1 3.7 6 7 6 2.59294 0.99975 0.00025 1
12 1 4.4 6 6 5 1.09690 0.96446 0.03554 1
13 1 3.6 7 7 7 3.94665 1.00000 0.00000 1
14 1 4 6 6 7 2.71242 0.99984 0.00016 1
15 2 5 5 6 4 -0.27107 0.21714 0.78286 2
16 2 5.2 4 5 4 -1.49959 0.00450 0.99550 2
17 2 6 5 4 5 -0.84558 0.03890 0.96110 2
18 2 4 5 5 4 -0.91654 0.03092 0.96908 2
19 2 4.7 5 4 5 -0.80848 0.04382 0.95618 2
20 2 4.8 4 4 4 -2.16218 0.00049 0.99951 2
21 2 6.1 3 3 5 -2.62004 0.00011 0.99989 2
22 2 3 3 4 5 -1.85755 0.00136 0.99864 2
23 2 5 4 5 5 -0.69183 0.06344 0.93656 2
24 2 4 4 4 5 -1.33730 0.00773 0.99227 2
25 2 6 3 4 4 -2.74523 0.00007 0.99993 2
26 2 7 2 4 4 -3.32257 0.00001 0.99999 2
27 2 5.6 5 4 4 -1.63621 0.00285 0.99715 2
28 2 5.2 4 3 4 -2.84761 0.00005 0.99995 2
29 2 3.4 4 5 5 -0.64616 0.07316 0.92684 2
30 2 4.7 5 4 5 -0.80848 0.04382 0.95618 2

Keterangan: Z Scores, peluang ke grup 1, peluang ke grup 2 dan predicted group


merupakan hasil analisis yang diberikan oleh SPSS.
Tabel 6-2. Sampel Holdout

Pre-dicted Peluang Peluang ke


Resp. Jalur X1 X2 X3 X4 Z Scores
Group ke Grup 1 Grup 2
1 1 3.1 6 6 7 1 2.28368 0.99991 0.00009
2 1 4.3 6 6 5 1 1.87884 0.99952 0.00048
3 1 5.1 6 5 5 1 0.90715 0.97562 0.02438
4 1 4.5 6 7 5 1 2.79679 0.99999 0.00001
5 1 3 6 6 6 1 2.11887 0.99982 0.00018
6 1 4 5 7 6 1 1.96776 0.99967 0.00033
7 1 4.2 7 5 7 1 2.32194 0.99992 0.00008
8 1 5.1 6 7 7 1 3.1049 1.00000 0.00000
9 1 3.6 5 6 6 1 1.06056 0.98679 0.01321
10 1 4 6 6 5 1 1.89496 0.99955 0.00045
11 2 4.7 4 3 4 2 -3.15108 0.00000 1.00000
12 2 5.7 4 3 5 2 -3.03464 0.00000 1.00000
13 2 4 4 4 5 2 -2.01458 0.00028 0.99972
14 2 5.1 5 5 5 2 -0.11893 0.38138 0.61862
15 2 4.2 5 4 5 2 -0.99926 0.01689 0.98311
16 2 4.7 4 4 4 2 -2.22238 0.00012 0.99988
17 2 6 3 4 4 2 -3.31831 0.00000 1.00000
18 2 5 4 4 4 2 -2.2385 0.00011 0.99989
19 2 5 4 3 4 2 -3.1672 0.00000 1.00000
20 2 4.2 5 5 5 2 -0.07056 0.42874 0.57126

Keterangan: Z Scores, peluang ke grup 1, peluang ke grup 2 dan predicted group


merupakan hasil analisis yang diberikan oleh SPSS.

Langkah-langkah Analisis Diskriminan

1. Buka program SPSS. Lalu, pada layar, isikan data Tabel 6-1. Lakukan
penyesuaian nama variabel dan angka desimal melalui menu View, seperti tampak
di layar (hanya sebagian layar ditampilkan di sini).

2. Dari menu utama, pilih analyze>classify>discriminant. Kemudian, dari


kotak dialog yang muncul, masukkan variabel ‘d’ sebagai gouping variables.
Kemudian, klik define range. Lalu, pada kotak dialog kecil yang muncul,
masukkan angka 1 pada sel minimum dan angka 2 pada sel maximum. Tampak di layar
sebagai berikut:
3. Untuk kembali pada kotak dialog disriminant, pada kotak dialog Define
range, klik Continue. Pada kotak dialog Discriminant analysis, klik Statistics,
kemudian, pada kotak dialog Statistics, tandai sel Means, Unstandardized dan
Within-goups correlations. Lalu, klik Continue.

4. Dari kotak dialog Discriminant analysis, klik Save, kemudian pada kotak
dialog save yang muncul sesudahnya, pilih fasilitas-fasilitas seperti ditandai
di bawah ini. Dengan fasilitas-fasilitas tersebut, SPSS akan memprediksi
keanggotaan setiap responden, skor diskriminan responden, serta peluang
keanggotaan responden pada grup 1 dan grup 2 (Hasilnya pada Tabel 6-1 di atas).
5. Terakhir, pada kotak dialog discriminant analysis, klik OK, kemudian
didapatlah hasil seperti pada Tabel 6-3.

INTERPRETASI OUTPUT

Hasil analisis diskriminan dimulai dengan analisis deskriptif. Pada Output 1,


dari statistik grup (group statistics) terlihat bahwa beda rata-rata variabel
setiap grup dan rata-rata total. Rata-rata ini, kalau antar grup berbeda,
mengindikasikan bahwa variabel-variabel di dalamnya berperan dalam
mengelompokkan responden. Sekiranya rata-rata sebuah variabel sama pada kedua
grup, bolehlah kita percaya bahwa variabel tersebut tidak berperan dalam
mengelompokkan objek (atau responden).

Standar deviasi juga merupakan indikator apakah variabel berperan baik sebagai
diskriminator ataukah tidak. Sangat baik kalau standar deviasi dalam grup
lebih rendah dari standar deviasi total, sebab dalam grup tentu nilai variabel
lebih homogen. Pada Output 1, semua variabel memenuhi syarat ini, kecuali
variabel gaji, di mana standar deviasi gaji (variabel X1) grup 2 lebih tinggi
dibanding standar deviasi total. Memang, terbukti kemudian dari standardized
coefficient dan structure matrix, peran variabel ini dalam mendiskriminasi
objek paling rendah.

Pooled within-groups correlation matrix mengindikasikan korelasi yang rendah


antar variabel-variabel prediktor. Sehingga, multikolinearitas dapat
diabaikan.
Apakah kedua grup berasal dari populasi yang sama? Syaratnya memang demikian.
Untuk menjawabnya, perlu dipastikan bahwa matrik covariance kedua grup sama.
Untuk membuktikannya, digunakan Statistik Box’s M. Statistik ini menguji
hipothesis:

Ho: Matrik cocariance kedua grup sama

Ha: Matrik covariance kedua grup tidak sama

Box’s M Test of Equality of Covariance Matrices

Untuk contoh ini, nilai Box’s M adalah 10.892 dengan nilai sig.=0.515. Dengan
demikian tidak cukup bukti untuk menolak Ho. Jadi, matrik kovarian kedua grup
adalah sama. Dengan demikian, dari kriteria ini, analisis diskriminan dapat
dilakukan.
Pada Output 2, dengan µ=0,05, maka nilai signifikansi nilai F menunjukkan
bahwa ketika diperiksa secara sendiri-sendiri, semua variabel prediktor
signifikan (karena nilai signifikansinya di bawah 0,05). Hipothesis yang diuji
adalah:

H0: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah
sama.

Ha: Rata-rata variabel ke-i pada kedua grup diskriminan yang terbentuk adalah
tidak sama.

Dengan nilai sig. semua variabel di bawah 0.05, punya cukup bukti untuk menolak
H0 dan menyatakan bahwa memang rata-rata variabel pada kedua grup diskriminan
yang terbentuk adalah berbeda.

Karena hanya dua grup yang dibentuk, maka fungsi diskriminan hanya ada satu,
dengan eigenvalue sebesar 2,993 yang sudah mencakup 100 % varians yang
dijelaskan (explained variance).

Korelasi kanonikal adalah 0,866. Koefisien determinasi (r2) diperoleh dengan


memangkatduakan korelasi kanonikal: (0,866)2=0,750. Angka ini mengindikasikan
bahwa 75% varian dalam dependen variabel dapat dijelaskan oleh model.

Uji Signifikansi

Tak ada gunanya mengintepretasi hasil analisis diskriminan kalau fungsinya


tidak signifikan. Hipothesis yang mau diuji adalah:

H0: Rata-rata semua variabel dalam semua grup (dalam contoh ini dua grup)
adalah sama.

Sedangkan hipothesis alternatifnya (Ha) adalah paling rata-rata variabel satu


variabel pada kedua grup adalah berbeda. Dalam SPSS, uji dilakukan dengan
menggunakan Wilks’ λ. Kalau beberapa fungsi diuji sekaligus, sebagaimana
dilakukan pada analisis diskriminan, statistik Wilks’ λ adalah hasil λ
univariat untuk setiap fungsi.

Nilai Wilk’s lambda ditransformasi menjadi nilai chi-square. Pada hasil Output
4 terlihat bahwa Wilks’ λ berasosiasi sebesar 0,250 dengan fungsi diskriminan.
Angka ini kemudian ditransformasi menjadi chi-quare dengan derajat kebebasan
(ditulis df, singkatan dari degree of freedom) sebesar 4. Nilai chi-square
adalah dengan nilai 36,001. Kesimpulannya, cukup bukti untuk menolak H0 dengan
tingkat kesalahan (atau µ)=0,000. Dengan demikian kita dapat menyimpulkan
bahwa fungsi memiliki kemampuan melakukan diskriminasi.

Tingkat kepentingan prediktor

Untuk menjawab pertanyaan: “Variabel independen (disebut juga ‘variabel


prediktor’ atau ‘prediktor’ saja) mana saja yang paling berperan
(berkontribusi) dalam melakukan diskriminasi?” Pertama lihat “standardized
coefficient”. Secara relatif, prediktor yang memiliki ‘standardized coeficient’
yang lebih besar menyumbangkan kekuatan diskriminasi (discriminating power)
yang lebih besar terhadap fungsi, dibanding prediktor yang memiliki
standardized coefficient lebih kecil. Jadi, seperti terlihat pada Output 5,
dengan skor 0,545, prediktor ‘daya tarik topik’, memiliki tingkat kepentingan
paling tinggi. Dengan skor -0,026 prediktor gaji memiliki peran yang paling
kecil.

Kedua, peneliti juga bisa menggunakan structure matrix, yang juga disebut
canonical loadings dan discriminant loadings. Jangan perhatikan negatif atau
positifnya. Perhatikan nilai mutlaknya. Pada Output 6, dengan structure
matrix, kita dapat menyimpulkan bahwa peran diskriminasi dari yang tertinggi
sampai terendah adalah kemampuan peneliti, daya tarik topik, sikap terhadap
litbang dan gaji dosen.
Ketiga, kita dapat menggunakan nilai F per prediktor (Output 2), yang disebut
univariate F ratio. Semakin besar nilai F, kontribusi terhadap diskriminasi
semakin tinggi.

Nah, sekarang kita bandingkan tingkat kepentingan prediktor berdasarkan ketiga


kriteria di atas (Tabel 6-3). Kesimpulan kita memang bisa berbeda, tergantung
dari mana kita melihatnya. Disarankan, peneliti cukup menggunakan satu kriteria
saja agar kesimpulan yang berbeda dapat dihindarkan.

Tabel 6-3. Ringkasan Interpretasi Tingkat Kepentingan Variabel

Standardized Discriminant Univariate F


Variabel Coefficient Loadings Ratio
Nilai Ranking Nilai Ranking Nilai Ranking
X1 -0.02557 4 -0,365 4 11.16123 4
X2 0.455568 3 0,620 3 32.1756 3
X3 0.539336 2 0,679 1 38.68685 1
X4 0.545003 1 0,627 2 33.00184 2

Fungsi Diskriminan

Dengan menggunakan ‘canonical discriminant function coefficients, kita dapat


membentuk fungsi diskriminan, yaitu:

D = -10.125 – 0,029X1+ 0,674X2 + 0,549X3+0,802X4

Sebetulnya, koefisien di atas merupakan penyederhanaan dengan memberikan angka


tiga desimal di belakang koma, seperti dihasilkan oleh program SPSS. Kalau
output SPSS kita impor dengan program Excel, maka angka di belakang koma nilai
koefisien lebih banyak, sehingga dengan memakai angka demikian, perhitungan
skor diskriminan secara manual lebih presisi. Cara mengimpor adalah dengan
mengkopi tabel output SPSS itu, lalu membuka Excel, terus melakukan Paste pada
file yang telah dibuka itu. Hasilnya, seperti pada Output 7.

Dengan program SPSS sebenarnya kita tidak perlu lagi menghitung skor
diskriminan (disebut juga Z scores) karena sudah disediakan oleh SPSS. Akan
tetapi, untuk meningkatkan pemahaman, kita perlu mengetahui dari mana datangnya
skor-skor itu. Persamaan di bawah ini, yang menggunakan koefisien dari Output
7, dapat dipakai menghitung skor diskriminan dengan presisi tinggi.

D=-10.124622 – 0,028541X1 + 0,5488X2 + 0,674008X3 + 0,802052X4

Sekiranya kita menggunakan skor diskriminan yang telah diberikan oleh program
komputer, maka persamaan pertama tidak bermasalah. Persamaan ini baru
bermasalah kalau kita menghitung skor diskriminan secara manual, sebab angkanya
bisa berbeda (walaupun tidak banyak) dengan skor diskriminan yang diberikan
komputer. Lihat pengerjaan manual di bawah ini.

Output 7. Canonical Discriminant Function Coefficient dengan Enam Angka di


Belakang Koma.

Canonical Discriminant
Function Coefficients
Function
1
GAJI -0.028541
KMAMPUAN 0.548800
SIKAP 0.674008
DAYATAR 0.802052
(Constant) -10.124622
Unstandardized coefficients

Sumber: Output SPSS

Dengan persamaan kedua, untuk responden pertama, skor diskriminan adalah:

D=-10.124622 – 0,028541(3.2) + 0,5488(5) + 0,674008(6) +0,802052(7) = 2,18646

Sedangkan dengan persamaan pertama, skor diskriminan adalah:

D=-10.126-0,029(3.2)+0,674(5)+0.549(6)+0.802(7)=2.3708

Hasilnya berbeda, bukan? Memang, dengan persamaan pertamalah diperoleh semua


skor pada Tabel 6,1.

Validasi

Cutting score determination


Sebelum analisis diskriminan dilakukan, kita hanya mempunyai dua skor
berdasarkan jalur yang dipilih, yaitu 1 dan 2. Angka 1 menyatakan penelitian
yang dibiayai Litbang, angka 2 menyatakan penelitian atas biaya sendiri. Skor
diskriminan yang kita cari dapat dipakai untuk memprediksi jalur setiap
responden, apakah golongan 1 atau 2. Misalnya, dengan skor diskriminan
sebesar 2,18646, dapatkah kita prediksi masuk mana responden 1? Jawabannya
dapat.

Untuk memprediksi responden mana masuk golongan mana, kita dapat menggunakan
optimum cutting score. Memang dari komputer, informasi ini sudah diperoleh.
Akan tetapi, tak ada salahnya kalau kita mengetahui cara mengerjakannya secara
manual.

Rumus yang digunakan berbeda untuk grup yang proporsional (kedua grup mempunyai
jumlah anggota yang sama) dan yang tidak proporsional (jumlah anggota kedua
grup berbeda).

Untuk dua grup yang mempunyai ukuran yang sama (seperti sampel holdout Tabel
6-2), cutting score dinyatakan oleh rumus:

di mana

Zce = Cutting score untuk grup yang sama ukuran

ZA = Centroid grup A

ZB = Centroid grup B

Untuk sampel holdout, maka cutting score adalah:

Jadi, pembatasnya adalah 0,000. Kalau di atas 0,000 masuk grup 1 dan kalau di
bawah 0,000 masuk grup 2. Oleh karena itu, responden 1 pada sampel holdout,
dengan skor diskriminan 2,28368. Responden 11, dengan skor diskriminan
-3,15108, masuk grup 2. Dengan skor-skor yang ada, sekarang prediksilah setiap
responden.

Apabila dua grup berbeda ukuran, seperti sampel analisis, maka rumus cutting
score yang digunakan adalah:
Di mana,

ZCU = Cutting score untuk gurp tak sama ukuran

NA = Jumlah anggota grup A

NB = Jumlah anggota grup B

ZA = Centroid grup A

ZB = Centroid grup B

Untuk sampel analisis, maka cutting score adalah:

Responden 1 sampel analisis diprediksi ke grup 1 skor diskrimi-nannya


2,18646. Responden 3 yang aslinya masuk grup 1, diprediksi masuk grup 2 karena
skor diskriminannya di bawah cutting score, yaitu -0,14431. Ini namanya error
atau misclassified.

Tanpa cutting score pun, sebenarnya kita dapat langsung memprediksi grup setiap
responden, yaitu dengan melihat paling dekat ke centroid mana skor diskriminan
masing-masing objek. Misalnya, skor diskriman responden 1 sampel analisis,
yang sebesar 2.18646, tentunya lebih dekat ke 1.787 (centroid grup 1) daripada
ke -1,564 (centroid grup 2). Oleh karena itu diprediksi masuk ke grup 1.
Responden 15 sampel analisis, dengan skor diskriminan -0,27107, tentunya masuk
grup 2.

Program SPSS juga memberikan peluang masuk grup 1 dan grup 2. Peluang ke grup
mana paling besar dimiliki suatu objek, ke grup itulah objek tersebut kita
prediksi. Responden 1 sampel analisis, misalnya, memiliki peluang ke grup 1
sebesar 0,99904 dan ke grup 2 sebesar 0,00096. Tentunya, peluang ke grup 1
lebih besar, jadi ke grup itulah responden 1 diprediksi.

Hit ratio

Hit rasio adalah persentase kasus atau responden yang kelompoknya dapat
dipreksi secara tepat. Kalau jumlah seluruh kasus sampel analisis (atau
responden) adalah 30 (pada kedua grup), lalu fungsi diskiminan dapat
memprediksi 29 kasus secara tepat (hanya responden 3 yang error), maka hit
ratio adalah 29/30=96,67%. Tanpa menggunakan kriteria apa pun, karena mampu
memprediksi grup keanggotaan 29 responden dari total 30 responden dan hanya
satu yang salah prediksi, kita dapat menilai angka ini sangat bagus.
Untuk sampel holdout, fungsi diskriminan mampu memprediksi keanggotaan semua
(100%) objek. Karena itu, tanpa kriteria statistik apa pun, dapatlah kita
yakin bahwa fungsi diskriminan, baik sampel analisis maupun holdout, memiliki
keakuran yang tinggi.

Pertanyaannya, bagaimana kalau hit rasio tidak sebaik itu? Misalnya 60%,
apakah dapat diterima?

Kalau ukuran setiap grup sama, lihat nilai kesempatan klasifikasi. Menurut
Maholtra (2006), kesempatan klasifikasi untuk grup berukuran sama adalah 1
dibagi jumlah grup. Untuk sampel yang terdiri dari 2 grup, maka kesempatan
klasifikasi adalah ½ atau 0,50.
Hair et. al. (2006) menyatakan bahwa kriteria hit ratio yang baik adalah kalau
sama atau melebihi kesempatan klasifikasi ditambah seperempatnya. Kalau
kesempatan klasifikasi adalah 50%, maka batas minimal hit rasio adalah 0,50 +
(0,25) (0,50)=0,625 atau 62,5%.

Kalau kita memiliki 4 grup, maka kesempatan klasifikasi adalah 25%. Dengan cara
yang sama, batas minimal hit ratio adalah 31,25%.

Untuk sampel holdout kriteria ini dapat digunakan. Sayangnya, dua grup dalam
sampel analisis tidak sama ukurannya. Kriteria kesempatan proporsional
(proportional chance ciriterion) dapat dipakai kalau ukuran grup-grup tidak
sama dan kalau tujuan peneliti adalah menentukan secara tepat keanggotaan objek
pada dua (atau lebih) grup. Rumusnya adalah

CPRO=p2+(1-p2)

Di mana:

p = proporsi responden pada grup 1

1-p = proporsi responden pada grup 2

Untuk sampel analisis, proporsi grup 1 adalah 46,67% dan proporsi grup 2 adalah
53,33%. Dengan kedua proporsi ini, maka kita dapat menghitung

CPRO=(0, 4667)2+(0,5333)2=0,5022=50,22%

Akurasi statistik.

Kita dapat menguji secara statistik apakah klasifikasi yang kita lakukan
(dengan menggunakan fungsi diskriminan) akurat atau tidak. Uji statistik yang
digunakan dinamakan Press’s Q Statistic. Ukuran sederhana ini membandingkan
jumlah kasus yang diklasifikasi secara tepat dengan ukuran sampel dan jumlah
grup. Nilai yang diperoleh dari perhitungan kemudian dibandingkan dengan nilai
kritis (critical value) yang diambil dari table Chi-Square dengan derajat
kebebasan satu (ditulis dk=1 atau df=1 atau v=1) dan tingkat keyakinan sesuai
keinginan kita. Statistik Q ditulis dengan rumus:

di mana

N = ukuran total sampel

n = jumlah kasus yang diklasifikasi secara tepat

K = jumlah grup

Untuk sampel analisis, kita dapat menghitung:

Dengan µ=0,05 dan df=1, nilai X2 tabel adalah 3,841. Dengan demikian, dapat
kita simpulkan bahwa fungsi diskriminan kita akurat.

Anda mungkin juga menyukai