Anda di halaman 1dari 10

PERBANDINGAN KINERJA PENAKSIR ROBUST MCD

DAN MWCD DALAM ANALISIS DISKRIMINAN KUADRATIK


Oleh: Suryana
1
Abstrak
Penerapan analisis diskriminan untuk mengelompokkan objek atau individu ke dalam salah
satu kelompok yang telah diketahui dalam suatu populasi begitu saja tidak cukup, perlu
dipertimbangkan keberadaan pengamatan outlier. Fungsi diskriminan klasik didasarkan pada estimasi
vektor rata-rata dan matrik kovariansi sampel. Keduanya tidak robust terhadap keberadaan
pengamatan outlier. Akibatnya fungsi diskriminan yang dihasilkan juga tidak robust. Dengan
menggantikan vektor rata-rata dan matrik kovariansi sampel klasik dengan vektor rata-rata dan matrik
kovariansi yang robust akan dihasilkan fungsi diskriminan yang robust juga. Selain itu, seringkali
ditemukan matrik kovariansi dua kelompok berbeda. Masalah ini tidak dapat diselesaikan dengan
menggunakan fungsi diskriminan linear. Sebagai solusinya diperlukan fungsi diskriminan kuadratik.
Kombinasi antara fungsi diskriminan kuadratik dan fungsi diskriminan robust dapat mengatasi
permasalahan perbedaan matrik kovariansi dan keberadaan pengamatan outlier dalam data. Dalam
penelitian ini akan digunakan penggunaan penaksir robust MCD dan MWCD dalam analisis
diskriminan kuadratik.
Untuk mengukur kinerja MCD dan MWCD dalam analisis diskriminan kuadratik digunakan
data simulasi yang terdiri dari data tanpa kontaminasi outlier dan data dengan kontaminasi outlier 10,
25, dan 30 persen. Pertama, ditentukan vektor rata-rata dan matrik kovariansi dengan menggunakan
MCD dan MWCD. Kedua, dihitung skor masing-masing objek berdasarkan fungsi diskriminan klasik
dan fungsi diskriminan robust . Terakhir kinerja fungsi diskriminan yang dihasilkan dievaluasi dengan
menggunakan metode APER. Hasil simulasi menunjukkan kinerja penaksir robust MCD dalam
analisis diskriminan kuadratik merupakan yang terbaik. Dari 100 pengulangan, rata-rata probabilita
salah pengelompokkan dari fungsi diskriminan kuadratik dengan menggunakan penaksir MCD
merupakan yang terkecil. Standar deviasi salah pengelompokkan terkecil dihasilkan oleh penaksir
robust MWCD meskipun dalam hal rata-ratanya cenderung tidak stabil, pada kasus tertentu terkecil
tetapi pada kasus lainnya terbesar.
Kata Kunci: diskriminan robust, MCD, MWCD, outlier.
1. Pendahuluan
Analisis diskriminan adalah salah satu teknik analisis multivariat yang dapat digunakan untuk
mengelompokkan objek/individu ke dalam kelompok yang telah didefinisikan sebelumnya. Untuk itu,
diperlukan suatu aturan yang dapat mengenali asal kelompok suatu objek.
Dalam analisis diskriminan, data terbagi dalam l kelompok dengan masing-masing jumlah
observasi n
1
, n
2
, . . . , n
l
di mana
1
.
l
j
j
n n

Masing-masing observasi dinotasikan dengan


ij
x
dengan 1, . . . ,
l
i n dan 1, . . . , . j l Diasumsikan setiap observasi dalam kelompok
j

dengan
1, . . . , j l dapat dijelaskan oleh random variabel
j
X
berdimensi p dengan densitas
.
j
f
Probabilita
1
Mahasiswa S2 Jurusan Statistika Institut Teknologi Sepuluh Nopember Surabaya
sebuah observasi termasuk dalam kelompok
j

adalah
.
j
p
Bila
j
f
berdistribusi normal multivariat,
maka sebuah observasi
p
R x
akan termasuk dalam kelompok
k
jika skor diskriminan kuadratik
( ) ( ) { }
max ; 1, . . . , ,
Q Q
k j
d d j l x x
dengan
( ) ( ) ( ) ( )
1
1 1
ln ln
2 2
t
Q
j j j j j j
d p

+ x x x ,
di mana
j

= matrik kovariansi dalam kelompok


j

,
j

= vektor rata-rata dalam kelompok


j

.
Kenyataannya,
j

dan
j

tidak diketahui. Kedua parameter ini ditaksir dari data sampel.


Penaksir tak bias untuk
j

dan
j

adalah
dan
j j
x S
. Skor diskriminan kuadratik berdasarkan data
sampel dihitung dengan formula:
( ) ( ) ( ) ( )
1
1 1
ln ln
2 2
t
QMLE
j j j j j j
d p

+ x S x x S x x .
Akan tetapi, kedua penaksir
dan
j j
x S
sangat dipengaruhi oleh kehadiran observasi outlier. Nilai
breakdown
dan
j j
x S
adalah nol (Casela dan Berger, 2002). Akibatnya, skor diskriminan yang
dihasilkan menjadi tidak robust.
Agar skor diskriminan menjadi robust,
j

dan
j

harus ditaksir dengan penaksir robust.


Penaksir robust vektor rata-rata dan matrik kovariansi diantaranya penaksir S (Rocke, 1996;
Campbell, 1998; Lopuhaa, 1989; 1991), Minimum Covariance Determinant (MCD) oleh Rousseeuw
dan Van Driessen (1999) dan Minimum Weighted Covariance Determinant (MWCD) oleh Roelant,
Van Aelst dan Williems (2006).
Penerapan penaksir robust dalam analisis diskriminan telah dilakukan beberapa peneliti.
Perbandingan kinerja fungsi diskriminan linear dengan menggunakan MCD, M, S, dan Orthogonalize
Gnadadesikan-Kettering telah dikemukakan oleh Todorov dan Pires pada tahun 2007. Hasil kajian
Todorov dan Pires (2007) menunjukkan tidak ada satupun metode estimasi robust yang dominan pada
berbagai kondisi. Joossen (2006) membandingkan kinerja diskriminan linear dan kuadratik robust
dengan menggunakan S dan MCD. Diskriminan kuadratik dengan MCD menghasilkan probabilita
salah pengelompokkan lebih kecil dibandingkan S.
Tujuan makalah ini membandingkan kinerja penaksir robust MCD dan MWCD dalam analisis
diskriminan kuadratik. Kinerja yang dimaksud diukur dengan probabilita salah pengelompokkan dari
aturan diskriminan kuadratik yang dihasilkan dibandingkan dengan penaksir yang tidak robust
dan
j j
x S
. Penghitungan probabilita salah pengelompokkan dari fungsi diskriminan dengan
menggunakan metode APER (Apparent Error Rate). Metode ini menyertakan seluruh observasi baik
pada saat pembentukan fungsi diskriminan maupun pada saat evaluasi kinerja dari fungsi diskriminan
yang terbentuk. Dalam jumlah data yang besar, metode ini sesuai karena membutuhkan waktu sedikit.
Penulisan makalah disusun dengan struktur sebagai berikut. Pada bagian selanjutnya akan
dibahas penaksir robust MCD dan MWCD. Bagian ini akan mengulas beberapa kelebihan MCD dan
MWCD dibandingkan penaksir robust lainnya. Pada bagian 3 akan dibahas analisis diskriminan
kuadratik dengan menggunakan MCD, MWCD dan metode klasik (MLE). Kinerja aturan diskriminan
dari ketiga metode tersebut diukur dengan menggunakan data simulasi. Makalah ini ditutup dengan
kesimpulan yang dipaparkan pada bagian 4.
2. Penaksir Robust MCD dan MWCD dalam Skor Diskriminan Kuadratik
Menurut Hubert (2001) ada beberapa kelebihan MCD. Pertama, MCD memiliki sifat statistik
yang baik karena memenuhi sifat affine equivariant dan terdistribusi normal asimtotik. MCD juga
tergolong penaksir robust tingkat tinggi karena memenuhi batas nilai maksimum 50 persen nilai
breakdown. Dari sudut pandang ketersediaan paket program, MCD telah terakomodir dalam S-PLUS
dan SAS dan Matlab dengan menggunakan algoritma Fast-MCD (Van Driessen dan Rousseeuw,
1999).
Definisi 1 MCD
MCD merupakan pasangan ( ) t X dan ( ) C X dari suatu sub sampel berukuran h pengamatan di mana
determinan matrik kovariansi dari sub-sampel tersebut adalah minimal dengan
0
h h n dan
0
h
merupakan nilai integer terkecil dari ( ) ( )
1 / 2 n p + + ,
( )
( ) { }
min det , 1, . . . ,
j
n
MCD C j
h
_


,
X ,
dengan:
( ) ( ) ( )
( )
( )
( )
1 1
1 1
;
1
h h
t
i i i
j j
i i
t C t t
h h


X x X x X x X
Untuk menghitung MCD dengan algoritma FAST-MCD dilakukan dengan langkah-langkah sebagai
berikut:
a. Ambil sejumlah h
0
pengamatan yang berbeda. Dari n pengamatan akan dihasilkan
n
c
_

,
himpunan
baru. Nilai h
0
yang optimal memenuhi (n + p + 1)/2.
b. Definisikan himpunan pertama sebagai H
1
. Berdasarkan himpunan H
1
hitung vektor rata-rata dan
matrik kovariansi ( )
1 1
, x S . Selanjutnya hitung det(S
1
).
c. Definisikan himpunan kedua H
2
. Berdasarkan himpunan H
1
hitung vektor rata-rata dan matrik
kovariansi ( )
2 2
, x S . Selanjutnya hitung det(S
2
).
d. Bandingkan det(S
2
) dengan det(S
1
). Bila det(S
2
) det(S
1
) ulangi langkah pada poin c untuk
himpunan berikutnya sampai dipenuhi kondisi det(S
m+1
) = det(S
m
).
e. Tetapkan anggota himpunan H
m
sebagai himpunan dengan determinan matrik kovariansi terkecil.
f. Berdasarkan H
m
data selanjutnya diberi bobot
( ) ( )
1 2
,0.975
1 jika
0 jika lainnya
t
i m m i m p
i
w

'

x x S x x
g. Berdasarkan bobot pada , maka MCD dihitung sebagai
( ) ( )
1
1
1
1
1
n
i i
i
MCD n
i
i
n
t
i i MCD i MCD
i
MCD n
i
i
w
w
w
w

x
x
x x x x
S
Skor diskriminan kuadratik dengan menggunakan penaksir robust MCD diperoleh dengan
menggantikan penaksir vektor rata-rata dan matrik kovariansi pada dengan . Adapun formulasinya
sebagai berikut:
( ) ( ) ( ) ( )
1
1 1
ln ln
2 2
t
QMCD
j MCDj MCDj MCDj MCDj j
d p

+ x S x x S x x .
Observasi
p
R x
akan termasuk dalam kelompok
k
jika skor diskriminan kuadratik
( ) ( ) { }
max ; 1, . . . , .
QMCD QMCD
k j
d d j l x x
Penaksir robust MWCD adalah pengembangan lebih lanjut MCD. Dengan memberikan
pembobot yang berbeda pada h subset matrik data X yang determinan matrik kovariansi minimal
menjadikan MCD menjadi MWCD.

Definisi 2 MWCD (Roelant dkk, 2006)
Pertimbangkan suatu fungsi pembobot ( ) ( ) ( )
/ 1 , 1, . . . ,
n
a i h i n i n
+
+ dengan
( ) : 0,1 [0, ) h
+
sedemikian sehingga
( ) { }
sup ; 0 1 u h u
+
>
dengan ( ) ( 0 1 2 dan 0 untuk 0,1 ]. h u u
+
>
MWCD adalah setiap penyelesaian
( )
( )
( )
, ;det 1

, arg min ,
MWCD n MWCD n
m C C
X C D m C

dengan
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
2
1
2 1
2 2 2
1
, ,
,
rank dari , di antara , , . . . , ,
n
n n i i
i
t
i i i
i i n
D m C a R d m C
d m C x m C x m
R d m C d m C d m C

Beberapa sifat baik dari MWCD adalah:


a. Breakdown Point dari MWCD
( )
( )
* *
min( 1, ( ))

, ,
n
n MWCD n n MWCD n
n k k k X
X X
n

+

dengan
k = jumlah observasi yang diberi bobot tidak sama dengan nol.
( )
n
k X = jumlah observasi maksimal yang terletak pada hyperplane yang sama dari
p
R
.
b. Pada data dengan sedikit kontaminasi outlier menghasilkan MSE dan Bias yang lebih kecil.
Skor diskriminan kuadratik dengan menggunakan penaksir robust MWCD diperoleh dengan
menggantikan penaksir vektor rata-rata dan matrik kovariansi pada dengan . Adapun formulasinya
sebagai berikut:
( ) ( ) ( ) ( )
1
1 1

ln ln
2 2
t
QMWCD
j MWCDj MWCDj MWCDj MWCDj j
d p

+ x x x .
Observasi
p
R x
akan termasuk dalam kelompok
k
jika skor diskriminan kuadratik
( ) ( ) { }
max ; 1, . . . , .
QMWCD QMWCD
k j
d d j l x x
3. Analisis Diskriminan Kuadratik
Pada bagian ini penaksir robust MCD dan MWCD akan dielaborasi dengan skor diskriminan
kuadratik. Jumlah kelompok yang diamati dibatasi hanya dua kelompok masing-masing tiga variabel
yang dibangkitkan dari distribusi normal multivariat. Dampak penggantian penaksir matrik kovariansi
MLE dengan penaksir robust MCD dan MWCD dilihat dari probabilita salah pengelompokkan dari
skor diskriminan kuadaratik yang dihasilkan. Untuk maksud tersebut digunakan data simulasi pada
empat kondisi.
Kondisi A menggambarkan data tanpa kontaminasi outlier. Sebanyak 2000 data dibangkitkan
dari dua kelompok masing-masing terdiri dari 1000 data yang berasal dari distribusi normal
multivariat dengan matrik kovariansi yang berbeda. Adapun rinciannya sebagai berikut:
1 3
2 3
1 0.4 0 0
1000 0 , 0 0.4 0 ,
0 0 0 0.4
0 0.25 0 0
1000 1 , 0 0.75 0 .
0 0 0 0.75
N
N

_
1 1

1 1


1 1

1 1
] ]
,
_
1 1

1 1


1 1

1 1
] ]
,
Kondisi B menggambarkan data dengan kontaminasi outlier sebanyak 10 persen. Data
masing-masing kelompok terdiri dari 900 data seperti pada kondisi A ditambah dengan 100 data yang
didefinisikan sebagai kontaminan. Dengan mengubah struktur vektor rata-rata dan matrik kovariansi
diharapkan terjadi pergeseran parameter lokasi dan parameter skala pada kedua kelompok dari kondisi
A.
1 3 3
2 3 3
1 0.4 0 0 0 0.1 0 0
900 0 , 0 0.4 0 100 6 0 , 0 0.1 0 ,
0 0 0 0.4 1 0 0 0.1
0 0.25 0 0 1 0.1
900 1 , 0 0.75 0 100 6 0 , 25
0 0 0 0.75 0
N N
N N

_ _
1 1 1 1

1 1 1 1
+

1 1 1 1

1 1 1 1
] ] ] ]
, ,
_
1 1 1

1 1 1
+

1 1 1

1 1 1
] ] ]
,
0 0
0 0.1 0 .
0 0 0.1
_
1

1

1

1
]
,
Kondisi C menggambarkan data dengan kontaminasi outlier 25 persen. Berbeda
dengan dua kondisi sebelumnya, jumlah observasi masing-masing kelompok berbeda.
Kelompok 1 terdiri dari 1500 data terdiri dari 1125 data dasar dan 375 data kontaminan.
Kelompok 2 terdiri dari 500 data terdiri dari 375 data dasar dan 125 data kontaminan. Struktur
data kondisi C selengkapnya sebagai berikut:
1 3 3
2 3 3
1 0.4 0 0 0 0.1 0 0
1125 0 , 0 0.4 0 375 6 0 , 0 0.1 0 ,
0 0 0 0.4 1 0 0 0.1
0 0.25 0 0 1 0.
375 1 , 0 0.75 0 125 6 0 , 25
0 0 0 0.75 0
N N
N N

_ _
1 1 1 1

1 1 1 1
+

1 1 1 1

1 1 1 1
] ] ] ]
, ,
_
1 1 1

1 1 1
+

1 1 1

1 1 1
] ] ]
,
1 0 0
0 0.1 0 .
0 0 0.1
_
1

1

1

1
]
,
Terakhir, kondisi D menggambarkan data dengan kontaminasi outlier 30 persen
dengan jumlah observasi kedua kelompok sama. Struktur data kondisi D sebagai berikut:
1 3 3
2 3 3
1 0.4 0 0 0 0.1 0 0
700 0 , 0 0.4 0 300 6 0 , 0 0.1 0 ,
0 0 0 0.4 1 0 0 0.1
0 0.25 0 0 1 0.1
700 1 , 0 0.75 0 300 6 0 , 25
0 0 0 0.75 0
N N
N N

_ _
1 1 1 1

1 1 1 1
+

1 1 1 1

1 1 1 1
] ] ] ]
, ,
_
1 1 1

1 1 1
+

1 1 1

1 1 1
] ] ]
,
0 0
0 0.1 0 .
0 0 0.1
_
1

1

1

1
]
,
Masing-masing dari keempat kondisi data diulangi hingga 100 kali pengulangan.
Probabilita salah pengelompokkan dicatat untuk setiap kali pengulangan. Selanjutnya dihitung
rata-rata dan standar deviasi probabilita salah pengelompokkan dari 100 pengulangan
tersebut. Semakin kecil rata-rata probabilita salah pengelompokkan menunjukkan semakin
baik kinerja penaksir vektor rata-rata dan matrik kovariansi dalam analisis diskriminan
kuadratik. Semakin kecil standar deviasi probabilita salah pengelompokkan menunjukkan
fungsi diskriminan kuadratik yang dihasilkan semakin reliabel.
3.1 Hasil Simulasi Data Kondisi A
Tabel 1 menunjukkan rata-rata dan standar deviasi (angka di dalam kurung) dari 100
pengulangan data kondisi A. Angka 10, 25 dan 30 yang menyertai huruf kapital A
menunjukkan proporsi data yang diberikan bobot nol pada saat penghitungan skor
diskriminan kuadratik dengan menggunakan penaksir robust matrik kovariansi. Pada kasus
data tanpa kontaminasi tampak bahwa probabilita salah pengelompokkan dari diskriminan
kuadratik antara penaksir robust dan tidak robust tidak menunjukkan perbedaan yang berarti.
Tabel 1. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100
pengulangan fungsi diskriminan kuadratik pada kondisi A dengan menggunakan
penaksir MLE, MCD dan MWCD.
Data Statistik
Penaksir
MLE MCD MWCD
A_10
Rata-rata
Standar Deviasi
0.12913
(0.0075149)
0.12373
(0.0082546)
0.12954
(0.0076165)
A_25
Rata-rata
Standar Deviasi
0.12858
(0.0066456)
0.1229
(0.0066279)
0.12964
(0.0065508)
A_30
Rata-rata
Standar Deviasi
0.12859
(0.0078026)
0.12271
(0.0089719)
0.12964
(0.0084093)
Sumber: Hasil Pengolahan dengan Matlab 7.01
Meskipun demikian, secara absolut penaksir robust MCD menunjukkan kinerja
terbaik. Hal ini ditunjukkan dengan rata-rata probabilita salah pengelompokkan terkecil. Jika
ketiga metode penaksir disusun dari rata-rata salah pengelompokkannya tampak MCD < MLE
< MWCD. Akan tetapi dari standar deviasinya, penaksir MCD menghasilkan standar deviasi
yang lebih besar dari kedua metode lainnya.
3.2 Hasil Simulasi Data Kondisi B
Dengan menyertakan 10 persen outlier pada data dasar berdampak pada kinerja fungsi
diskriminan kuadratik. Kinerja MLE dan MWCD tampak memburuk. Rata-rata probabilita salah
pengelompokkan menjadi lebih besar daripada kondisi A. Penaksir MCD cenderung stabil. Hal ini
menunjukkan bahwa dengan kehadiran 10 persen observasi outlier, penaksir robust MCD tetap
resisten sekaligus menjadikan kinerja fungsi diskriminan kuadratik yang dihasilkan juga resisten
terhadap kehadiran observasi outlier. Meskipun rata-rata salah pengelompokkan penaksir MWCD
lebih besar dari penaksir MLE namun dari standar deviasinya ternyata lebih kecil. Hasil selengkapnya
dapat diamati pada Tabel 2.
Tabel 2. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100
pengulangan fungsi diskriminan kuadratik pada kondisi B dengan menggunakan
penaksir MLE, MCD dan MWCD.
Data Statistik
Penaksir
MLE MCD MWCD
B_10
Rata-rata
Standar Deviasi
0.18813
(0.010039)
0.1272
(0.0078783)
0.21521
(0.0073392)
B_25
Rata-rata
Standar Deviasi
0.1887
(0.01034)
0.12582
(0.0080923)
0.21582
(0.0070881)
B_30
Rata-rata
Standar Deviasi
0.18924
(0.010012)
0.12548
(0.0081907)
0.21584
(0.0068807)
Sumber: Hasil Pengolahan dengan Matlab 7.01
3.3 Hasil Simulasi Data Kondisi C
Pada kondisi C, penaksir MWCD dengan hanya menyertakan 90 persen data (Baris C_10)
memberikan rata-rata salah pengelompokkan terkecil. Akan tetapi, pada C_25 dan C_30 rata-rata salah
pengelompokkan kembali menjadi besar. Secara keseluruhan, Tabel 3 menunjukkan bahwa penaksir
MCD menunjukkan kinerja yang lebih baik karena rata-rata salah pengelompokkan yang dihasilkan
cenderung stabil dan lebih kecil dari MLE dan MWCD.
Tabel 3. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100
pengulangan fungsi diskriminan kuadratik pada kondisi C dengan menggunakan
penaksir MLE, MCD dan MWCD.
Data Statistik
Penaksir
MLE MCD MWCD
C_10
Rata-rata
Standar Deviasi
0.12121
(0.0061792)
0.11182
(0.007014)
0.10669
(0.0057396)
C_25
Rata-rata
Standar Deviasi
0.12027
(0.006694)
0.11385
(0.0074471)
0.33479
(0.0058019)
C_30
Rata-rata
Standar Deviasi
0.12028
(0.0070776)
0.10465
(0.008297)
0.33227
(0.0062444)
Sumber: Hasil Pengolahan dengan Matlab 7.01
3.4 Hasil Simulasi Data Kondisi D
Pada kondisi D, penaksir MWCD menujukkan kinerja yang tidak stabil. Rata-rata
salah pengelompokkan penaksir MWCD terendah pada D_25 tetapi terburuk pada D_30.
Secara umum kinerja MCD merupakan yang terbaik. Akan tetapi hasilnya tidak berbeda jauh
dari penaksir MLE. Hasil selengkapnya dapat dilihat pada Tabel 4.
Tabel 4. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100
pengulangan fungsi diskriminan kuadratik pada kondisi D dengan menggunakan
penaksir MLE, MCD dan MWCD.
Data Statistik
Penaksir
MLE MCD MWCD
D_10
Rata-rata
Standar Deviasi
0.15874
(0.0080868)
0.15309
(0.0087087)
0.18588
(0.0097196)
D_25
Rata-rata
Standar Deviasi
0.15939
(0.0082047)
0.15608
(0.010279)
0.12268
(0.011725)
D_30
Rata-rata
Standar Deviasi
0.15807
(0.0085093)
0.14563
(0.012834)
0.39075
(0.0061293)
Sumber: Hasil Pengolahan dengan Matlab 7.01
4. Kesimpulan
Berdasarkan hasil simulasi dari keempat kondisi data pada bagian 3, dapat ditarik
beberapa kesimpulan sebagai berikut:
1. Telah ditunjukkan dengan data simulasi bahwa kinerja penaksir robust MCD dalam
diskriminan kuadratik menghasilkan proporsi salah pengelompokkan yang lebih kecil
baik pada data terkontaminasi maupun data tanpa kontaminasi.
2. Pada data tanpa kontaminasi outlier, kinerja penaksir robust matrik kovariansi MCD dan
MWCD hampir serupa dengan kinerja penaksir MLE.
3. Kinerja penaksir robust MCD cenderung menghasilkan proporsi salah pengelompokkan
yang lebih kecil dibandingkan dengan penaksir MLE dan MWCD.
4. Kinerja penaksir robust MWCD dalam analisis diskriminan kuadratik cenderung
menunjukkan kinerja yang tidak stabil. Meskipun demikian, standar deviasi yang
dihasilkan cenderung lebih kecil dari kedua metode lainnya.
5. Referensi
Campbell, N. A., Lopuha, H. P., dan Rousseeuw, P. J., (1998), On The Calculation Of A Robust S-
Estimator Of A Covariance Matrix, Statist. Med., 17, 2685 2695.
Croux, Christophe dan Dehon, Catherine, (2001), Robust Linear Discriminant Analysis using S-
estimators, The Canadian Journal of Statistics, Vol. 29, 473 492.
Hawkins, Douglas M. dan McLachlan, Geoffrey J., (1997), High-Breakdown Linear Discriminant
Analysis, Journal of the American Statistical Association, Vol. 92, N0. 437, 136 143.
Hubert, M. dan Van Driessen, K., (2004), "Fast and Robust Discriminant Analysis," Computational
Statistics and Data Analysis, 45, 301-320.
Joossens, Kristel, (2006), Robust Diskriminan Analysis, Tesis Ph.D., Katholieke Universiteit Leuven,
Leuven.
Lopuhaa. H.P, (1989), On the Relation between S-estimators and M-estimator of multivariate location
and ovariance. Ann. Statist. 17, 1662-1683.
-----------------, (1991), Breakdown Point and Asymptotyc Properties of Multivariate S-Estimators
and -Estimators: A Summary, dalam Directions in Robust Statistics and Diagnostics Part I,
Editors: Stahel, Werner dan Weisberg, Sanford, The IMA Volumes in Mathematics and Its
Applications, Springer-Verlag, Volume 33.
Roelant, E., VanAelst, S., dan Williems, G., (2006), The Minimum Weighted Covariance
Determinant, ICORS, Lisbon.
Rocke D.M. (1996) Robustness properties of s-estimators of multivariate location and shape in high
dimension, Annals of Statistics, 24, 13271345.
Rousseeuw, Peter J., dan Van Driessen, K., (1999), A Fast Algorithm for the Minimum Covariance
Determinant Estimator, Technometrics. Vol. 41, No. 3, 212-223.
Todorov, Valentine, dan Pires, Ana M., (2007), Comparative Performace of Several Robust Linear
Discriminant Analysis Methods, REVSTAT Statistical Journal, Volume 5, Number 1, 6383.

Anda mungkin juga menyukai