Anda di halaman 1dari 12

Analisis Diskiminan

Setelah dilaksanakannya Analisis Gerombol, kemudian dilanjutkan

dengan Analisis Diskriminan. Menurut Johnson dan Wichern (1992), tujuan

dari Analisis Diskriminan adalah untuk menggambarkan ciri-ciri suatu

pengamatan dari bermacam-macam populasi yang diketahui, baik secara

grafis maupun aljabar dengan membentuk fungsi diskriminan. Dengan kata

lain Analisis Diskriminan digunakan untuk mengklasifikasikan individu ke

dalam salah satu dari dua kelompok atau lebih.

Suatu fungsi diskriminan layak untuk dibentuk bila terdapat

perbedaan nilai rataan di antara kelompok-kelompok yang ada. Oleh karena

itu sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap

perbedaan vektor nilai rataan dari kelompok-kelompok tersebut.

Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang

harus dipenuhi adalah:

 Peubah-pubah yang diamati menyebar secara normal ganda

(multivariate normality)

 Semua kelompok populasi mempunyai matrik ragam-peragam

yang sama

3.2.4.1 Uji Kenormalan Peubah Ganda


Menurut Karson (1982: 80), untuk menguji kenormalan peubah ganda

digunakan prosedur yang dikembangkan oleh Mardia dalam Susiyanto

(2003) dengan cara menghitung dua macam ukuran statistik yaitu ukuran

skewness (b1,p) dan kurtosis (b2,p), yaitu:


3

(b ) = (1 n )∑∑ ( X − X ) S −1 ( X u ' − X )
n n
2
1, p
 u =1 u '=1
u 

2

(b ) = (1 n) ∑ ( X − X ) S −1 ( X u − X ) 
n

2, p
u =1 
u 

Hipotesa yang digunakan adalah:

H0 : peubah ganda mengikuti sebaran normal

H1 : peubah ganda tidak mengikuti sebaran normal

Bila:

nb1,p /6 ≤ χp ( p +1)( p +2) / 6 , dan


2

[b2,p – p(p + 2)] / 8 p ( p +2) / n ≤ Zα (tabel normal), maka tidak ada

alasan untuk menolak H0, berarti peubah ganda mengikuti sebaran normal.

Menurut Johnson dan Wichern (1992), untuk menguji kenormalan

ganda adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan

yaitu: d 2j = ( X j − X )' S −1 ( X j − X ) , di mana Xj adalah pengamatan yang ke-j

dan S-1 adalah kebalikan (inverse) matriks ragam-peragam S


Kemudian d 2j diurutkan dari yang paling kecil ke yang paling besar,

2  j −1 2 
selanjutnya dibuat plot d 2j dengan nilai Chi-Kuadrat χ p  n  dimana: j
 

= urutan = 1, 2, ..., n dan p = banyaknya peubah. Bila hasil plot dapat

didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda

menyebar normal.

Menurut Nourosis dalam Susiyanto (2003), berdasar teori Wahl dan

Kronmal (1977), dikatakan bahwa seringkali kenormalan ganda sulit

diperoleh terutama bila sampel yang diambil relatif kecil. Bila hal ini terjadi,

uji vektor nilai rataan tetap bisa dilakukan selama asumsi kedua (kesamaan

ragam-peragam) dipenuhi.

3.2.4.2 Uji Kesamaan Matrik Ragam Peragam

Untuk menguji kesamaan matrik ragam-peragam (Σ ) antar kelompok

digunakan hipotesa:

H0 : Σ 0 = Σ 1 = Σ 2 = ....Σ k = Σ .

H1 : Sedikitnya ada dua kelompok yang berbeda.

Statistik uji yang digunakan adalah statistik Box’s M, yaitu:

(n − k ) − ∑( n j − 1) ln S j
k

-2lnλ = ( n − k ) ln W
*
j =1
k
( n j −1) / 2
∏S j
λ *= j =1
( n −k ) / 2
W /( n − k )

dimana:

k = banyaknya kelompok.

W / (n-k) = matrik ragam-peragam dalam kelompok gabungan.

Sj = matrik ragam-peragam kelompok ke-j.

Bila hipotesa nol (H0) benar, maka (-2lnλ *) / b akan mengikuti

sebaran F dengan derajat bebas v1 dan v2 pada taraf signifikansi α , dimana:

v1 = (1/2)(k –1)p(p + 1)

v2 = (v1+ 2) / (a2 – a12)

b = v1 / (1 – a1 - v1/ v2)

2 p 3 + 3 p −1  k 1 1 
a1 = ∑ − 
6(k −1)( p + 1)  j =1 ( n j −1) ( n − k ) 

( p − 1)( p + 2)  k 1 1 
a2 = ∑ − 2 
6(k + 1)  j =1 ( n j − 1)
2
(n − k ) 

p = jumlah peubah pembeda dalam fungsi diskriminan.

Sehingga apabila (-2lnλ *) / b ≤ Fv1,v2,α maka tidak ada alasan untuk

menolak H0 dan dapat disimpulkan bahwa antar kelompok mempunyai

matrik ragam-peragam yang sama dan sebaliknya bila (-2lnλ *) / b >


Fv1,v2,α maka H0 ditolak, yang berarti bahwa antar kelompok tidak

mempunyai matrik ragam–peragam yang sama.

3.2.4.3 Uji Vektor Nilai Rataan

Pengujian terhadap vektor nilai rataan antar kelompok dilakukan

dengan hipotesa:

H0 : µ 0 = µ 1 = µ 2 = ...= µ k

H1 : Sedikitnya ada dua kelompok yang berbeda

Statistik uji yang digunakan dalam pengujian hipotesis tersebut adalah

statistik V-Bartlett yang menyebar mengikuti sebaran Chi-kuadrat (χ 2)

dengan derajat bebas p(k - 1), apabila H0 benar.

Statistik V-Bartlett diperoleh melalui:

V = −[( n −1) −( p + k ) 2] ln( ∆)

dimana:

n = banyaknya pengamatan

p = banyaknya peubah dalam fungsi diskriminan

k = banyaknya kelompok

W
∆=
W +B
= Wilk’s lambda
dalam hal ini:

W = matrik jumlah kuadrat dan hasil kali data dalam kelompok

k ni

= ∑∑( X
i =1 j =1
ij − X i )( X ij − X i )'

B = matrik jumlah kuadrat dan hasil kali data antar kelompok.


k

= ∑n ( X
i =1
i i − X )( X i − X )'

Xij = pengamatan ke-j kelompok ke-i

Xi = vektor rataan kelompok ke-i

ni = jumlah pengamatan pada kelompok ke-i,

X = vektor rataan total

Apabila V ≤ χp ( k −1), (1−α) maka, tidak ada alasan untuk menolak H0,
2

ini berarti bahwa terdapat perbedaan vektor nilai rataan antar kelompok.

Sebaliknya bila V > χp ( k −1), (1−α) maka H0 ditolak.


2

Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka

fungsi diskriminan layak disusun untuk mengkaji hubungan antar kelompok

serta berguna untuk mengelompokkan suatu obyek ke salah satu kelompok

tersebut.
Penentuan peubah bebas dalam pembentukan fungsi diskriminan

dengan prosedur stepwise

Menurut Nourosis dalam Susiyanto (2003), apabila dalam suatu

penelitian menggunakan banyak peubah maka untuk efisiensi dalam

menentukan peubah mana yang berperan dalam pembentukan fungsi

diskriminan dilakukan melalui analisis diskriminan bertatar (stepwise

disciminant). Prosedur ini digunakan untuk menghilangkan informasi dari

peubah bebas yang kurang berguna dalam membentuk fungsi diskriminan.

Prosedur diskriminan bertatar dimulai dengan pemilihan peubah bebas yang

paling berarti.

Kriteria untuk melihat variabel yang paling berarti (peubah yang dapat

diikutsertakan dalam pembentukan fungsi diskriminan), yaitu:

1. Peubah yang memiliki nilai F terbesar.

2. Peubah yang memiliki nilai Wilk’s Lambda terkecil.

Peubah yang sudah terpilih bisa dikeluarkan dari fungsi diskriminan

jika informasi yang dikandung tentang perbedaan kelompok ada di beberapa

kombinasi peubah-peubah terpilih lainnya.

Pembentukan Fungsi Diskriminan


Analisis Diskriminan merupakan teknik statistik yang menggunakan

peubah tak bebas Y berupa peubah kategorik dan peubah bebasnya adalah

interval atau rasio. Fungsi diskriminan merupakan fungsi atau kombinasi

linier peubah-peubah asal yang akan menghasilkan cara terbaik dalam

pemisahan kelompok-kelompok. Fungsi ini akan memberikan nilai-nilai

yang sedekat mungkin dalam kelompok dan sejauh mungkin antar kelompok

(Dillon dalam Solikhah, 2003)

Banyaknya fungsi diskriminan yang terbentuk secara umum tergantung

dari min(p,k-1), dengan p adalah banyaknya peubah pembeda dan k adalah

banyaknya kelompok yang telah ditetapkan. Fungsi diskriminan ini diartikan

sebagai keragaman peubah yang terpilih sebagai kekuatan pembeda. Apabila

fungsi diskriminan yang terbentuk sebanyak lebih dari 1, maka dapat

dikatakan bahwa fungsi diskriminan pertama akan menjadi kekuatan

pembeda yang paling besar, demikian berturut-turut untuk fungsi berikutnya.

Fungsi diskriminan yang terbentuk mempunyai bentuk umum berupa

persamaan linier (Fisher’s Sample Linear Discriminant Function) yaitu:

ˆ x +
y1 =  ˆ x + + 
ˆ x + + 
ˆ x
11 1 12 2 1j j 1p p

y 2 = ˆ 21 x1 + ˆ 22 x 2 + + ˆ 2 j x j + + ˆ 2 p x p

y 3 = ˆ31 x1 + ˆ32 x 2 +  + ˆ3 j x j + + ˆ3 p x p

…………………………………………….
y i = ˆi1 x1 + ˆi 2 x 2 + + ˆij x j + + ˆip x p

……………………………………………

y q = ˆ q1 x1 + ˆ q 2 x 2 + + ˆ qj x j + + ˆ qp x p

dengan i=1,2,…,q (min p,k-1)

j=1,2,…,p

atau dapat ditulis sebagai

y =̂' x

dimana:

̂ = koefisien vektor

y = skor diskriminan

Nilai ̂ dipilih sedemikian sehingga fungsi diskriminan berbeda

sebesar mungkin antara kelompok, atau sehingga rasio antara jumlah kuadrat

antar kelompok dengan jumlah kuadrat dalam kelompok maksimum.

Penilaian Kekuatan Fungsi Diskriminan

Untuk mengetahui kekuatan fungsi diskriminan dalam menilai tiap-

tiap observasi dan mengelompokkannya ke dalam kelompok yang

didefinisikan dapat dilakukan dengan melihat:


1. Korelasi Kanonik (Canonical correlation)

Canonical Correlation (R) merupakan ukuran hubungan antara

kelompok yang terbentuk oleh y dengan fungsi diskriminan yang ada.

Ketika R adalah nol, maka hal ini dapat diartikan bahwa tidak ada

hubungan di antara kelompok-kelompok yang ada dengan fungsi yang

terbentuk. Sebaliknya apabila R-nya besar (mendekati 1), maka

menunjukkan adanya korelasi yang tinggi antara fungsi diskriminan

dengan kelompok yang ada. R ini digunakan untuk menjelaskan seberapa

besar masing-masing fungsi berguna dalam menentukan perbedaan

kelompok.

2. Akar Ciri (Eigen Value)

Nilai eigen value menunjukkan ada atau tidaknya multikolinearitas atau

terjadinya korelasi antar peubah bebas di dalam fungsi diskriminan.

Multikolinearitas akan terjadi bila eigen value mendekati 0 (nol).

3. Group Centroid

Group centroid merupakan rata-rata nilai diskriminan dari tiap-tiap

observasi di dalam masing-masing kelompok. Semakin besar perbedaan

group centroid antar kelompok, maka fungsi diskriminan yang diperoleh

semakin dapat membedakan kelompok yang ada.


Ketepatan Pengelompokan

Tingkat akurasi pengelompokkan sangat menentukan baik atau

tidaknya suatu pengelompokkan. Persentase ketepatan pengelompokan dapat

dihitung dari matrik klasifikasi yang menunjukkan nilai sebenarnya (actual

members) dan nilai prediksi (prediction members) dari setiap kelompok.

Rumus persentase ketepatan pengelompokan oleh fungsi diskriminan (hit

ratio) adalah:
k

∑n ic

Hit ratio = × 100%


i =1
k

∑n
i =1
i

dimana : ni = jumlah observasi dari µ i yang tepat dikelompokkan pada

µ i

nij = jumlah observasi dari µ i yang salah dikelompokkan pada

µ ij

dengan i =1,2,…,k dan j =1,2,…,k

Dalam prakteknya, hasil dari hit ratio ini sering dibandingkan dengan suatu

standar persentase tertentu. Ada 2 (dua) standar persentase yang sering

digunakan yaitu kriteria peluang proporsional (the proportional chance

criterion) dan kriteria peluang maksimum (the maximum chance criterion).


Kriteria peluang proporsional digunakan jika ukuran masing-masing

kelompok tidak sama dan peneliti ingin mengidentifikasi dengan tepat tiap-

tiap observasi dari 2 (dua) kelompok atau lebih. Rumus yang digunakan

untuk kriteria peluang proporsional ini adalah:


k

Cproporsional = ∑ pi
2

i =1

dimana:

Cproporsional = kriteria peluang proporsional dari model peluang.

p = proporsi jumlah observasi dari kelompok.

Kriteria peluang maksimum ditentukan dengan menghitung persentase total

observasi yang ditunjukkan oleh persentase terbesar dari dua kelompok atau

lebih.

Hair et. Al dalam Solikhah (2003) menyarankan bahwa persentase

ketepatan pengklasifikasian yang diperoleh melalui analisis diskriminan

paling tidak 25 persen lebih besar dari persentase yang diperoleh melalui

model peluang.