Anda di halaman 1dari 8

MODIFIKASI KERNEL PCA

PADA KELASIFIKASI AROMA MULTIKELAS


Zuherman Rustam
1
,Benyamn Kusum!"utr!
2
, Be#a$at %&'a'a
3
1. Fakultas MIPA , Jurusan Matematika ,Universitas Indonesia
2. Fakultas Ilmu Komputer , Universitas Indonesia.
3. Laboratorium Komputasi Inteleensia , Universitas Indonesia
A(stra)
Masala! kelasi"ikasi aroma merupakan masala! #an$ tidak muda!
untuk diselesaikan , karena data aroma memiliki karakteristik dan pola
#an$ san$at unik. %eberapa pen$uian tela! dilakukan antara lain
den$an men$$unakan metode&metode #an$ berbasis pada 'eural
net(ork , metode #an$ berbasis pa"a Fu))#&'euro dan metode&metode
#an$ berbasis pembelaaran statistika. Pen$$unaan P*A pada
kelasi"ikasi aroma dapat dikatakan $a$al, karena metode ini !an#a
dapat men#elesaikan masala! kelasi"ikasi untuk data #an$ linier. Untuk
data nonlineir ,nonseparable dan terdiri dari multikelas , metode P*A
perlu dimodi"ikasi. Pada makala! ini akan di$unakan Kernel P*A #an$
tela! dimodi"ikasi se!in$$a dapat di$unakan untuk kelasi"ikasi aroma
multikelas.
Kata Kunci : P*A , Kelasi"ikasi , Kernel.
PENDA*ULUAN
Masalah pembelajaran adalah
masalah pembentukan suatu fungsi
berdasarkan data yang ada , se-
demikian sehingga fungsi yang telah
terbentuk dapat digunakan untuk me-
naksir dengan tepat nilai dari fungsi
tersebut untuk input data yang lain
[Vapnik,1999]. ada masalah kelas-
ifikasi p!la, salah satu met!de yang
menunjukkan kinerja yang "ukup baik
adalah Linear +is,riminant Anal#sis
#$%&' [(ukunaga,199)]. Met!de ini
berbasis pada met!de statistika klasik
rinsip kerja dari met!de ini adalah
merubah masalah kelasifikasi menjadi
masalah ei$en&value.*etapi met!de
ini menemui kesulitan untuk me-
nyelesaikan masalah kelasifikasi n!n-
linier yaitu data tidak dapat dipisahkan
dengan menggunakan bidang linier.
+ntuk mengatasi hal ini Vapnik , me-
ngajukan k!nsep -tru,tural .isk
Minimi)ation. yang berbasis pada
-tatisti,al Learnin$ /!eor#. Met!de
yang ditemukan !leh Vapnik ini , me-
rupakan titk a,al mun"ulnya met!de-
met!de baru untuk menyelesaikan
masalah kelasifikasi p!la , salah satu
diantaranya adalah Prin,ipal *om&
ponents Anal#sis #-&' [.!llife,199/].
0arena kinerja -& belum menunjuk-
kan ke!ptimalannya pada kelasifikasi
p!la, salah satu penyebabnya adalah
data yang akan dikelasifikan tidak
dapat dipisahkan se"ara linier. +ntuk
.U-/AM, KU-UM0PU/.0, 1I+JAJA, M0+IFIKA-I K2.'2L 3 1
mengatasi hal ini maka mun"ul
met!de 0ernel -& #0-&'. 0ernel
-& merupakan -& yang di-
applikasikan pada input data yang
telah ditransf!rmasikan ke ruang
"eature. 1amun sampai saat ini 0(-&
baru berhasil untuk menyelesaikan
masalah kelasifikasi biner. ada
makalah ini 0-& akan diperluas
atau dim!difikasi sehingga dapat di-
gunakan untuk menyelesaikan masa-
lah kelasifikasi multikelas, khususnya
pada kelasifikasi ar!ma. +ntuk pem-
bahasan selanjutnya met!de ini di-
singkat dengan nama M0-&
#M!difikasi 0-&'.
ada tahun terakhir ini , pengujian
kelasifikasi ar!ma telah dilakukan
dengan menggunakan beberapa
met!de antara lain 2 met!de r!-
babilistik 1eural 1et,!rk #11'
[0usum!putr! dan 3erry , 2))2 4
.atmik! dan 0usum!putr!, 2))1a] ,
dengan .aringan 1eural 5uatan
[.atmik! dan 0usum!putr! , 2))1b] ,
0elasifikasi 6VM [7ustam,
0usum!putr!, 2))3] dan (u88y-1eur!
$V9 [0usum!putr! et al , 2))2] .
6istimatika penulisan makalah ini
sebagai berikut , pada bagian kedua
akan dibahas tentang dasar-dasar
0-&, pada bagian berikutnya akan
dibahas tenetang 0-& Multikelas ,
pada bagian akhir akan diperlihatkan
aplikasi 0-& multikelas pada
masalah kelasifikasi ar!ma.
KERNEL PCA
Misalkan
n
i
R x ,
m i ,.. 2 , 1 =
merupakan input data.
Matriks k!:ariansi untuk input data
tersebut diruang
n
R
adalah

=
= 1
/
1
i
i i
x x
m
A . 5erdasarkan prinsip
kerja dari -&, untuk menyelesaikan
masalah kelasifikasi p!la sama artinya
dengan menyelesaikan masalah
ei$envalue v Av = . Matriks
k!:ariansi umumnya tidak diketahui ,
untuk mendapatkan digunakan taksir-
an berdasarkan input data. 3al ini
dapat dilakukan jika input data terdiri
dari dari satu kelas. +ntuk masalah
multikelas diperlukan struktur -&
yang lebih k!mpleks. 6edangkan
untuk data n!nliner dan n!nseparable,
-& tidak dapat digunakan. 6alah
satu satu "ara agar -& dapat di-
gunakan adalah dengan melakukan
transf!rmasi semua input data ruang
"eature.
Misalkan F R
n
: fungsi
yang memetakan semua input data
n
i
R x keruang "eature F. +ntuk
setiap input data
n
i
R x , berlaku
F x
i
) ( . 5erdasarkan transf!rmasi
ini , terlihat bah,a ruang "eature
dibangun :ekt!r-:ekt!r
)} ( ),..., ( ), ( {
2 1 m
x x x
. 6ehingga semua
:ekt!r di ruang "eature dapat
dinyatakan sebagai k!mbinasi linier
dari :ekt!r-:ekt!r
)} ( ),..., ( ), ( {
2 1 m
x x x . %engan de-
mikian maka, matriks k!:ariansi di
ruang "eature untuk :ekt!r
)} ( ),..., ( ), ( {
2 1 m
x x x dapat ditulis-
kan sebagai2
) ( ) (
1
1
j
t
j
m
j
x x
m
C

=
=
#1'
JU.'AL I'F0.MA/IKA 4 K0MPU/2. '0. 3, JILI+ 5, 2663 2
dan masalah eigen-:alue di ruang
feature F dapat dinyatakan sebagai 2
Cv v = #2'
atau
Cv x v x
k k
), ( ), ( = ,
m k ,.., 2 , 1 = #3'
0arena semua :ekt!r di ruang
"eature F dapat dinyatakan sebagai
k!m-binasi linier dari :ekt!r-:ekt!r
)} ( ),..., ( ), ( {
2 1 m
x x x , maka
eigen:ekt!r , yang merupakan s!lusi
dari masalah eigen:alue Cv v = ,
juga dapat dinyatakan sebagai
k!mbinasi linier dari :ekt!r-:ekt!r
)} ( ),..., ( ), ( {
2 1 m
x x x . 3al ini
berarti, ada k!nstanta-k!ntanta
i

dimana m i ,.. 2 , 1 = , sedemikian se-
hingga

=
=
m
i
i i
x v
1
) ( #;'
%engan mensubstitusikan persamaan
#1' dan #;' ke persamaan #3' akan
dihasilkan persamaan 2
) ( )] ( ) ( ][ ) ( [
1
) ( ) (
1 1 1
k
t
j
t
m
j
j
m
i
i i
m
i
k
t
i i
x x x x
m
x x


= = =
, ,
m k ,.., 2 , 1 = #<'
Misalkan
) ( ) ( ) , (
j
t
i ij j i
x x k x x k = = #/'
dan
] [
ij
k K =
matriks ukuran m=m.
.ika pada persamaan #<' dilakukan
pergantian semua suku dalam bentuk
) ( ) (
j
t
i
x x dengan bentuk
ij
k
,
maka dapat dibuktikan bah,a per-
samaan #<' akan menjadi persamaan
#>'2
? ? KK mK =
#>'
dimana ? adalah :ekt!r k!l!m
dengan entry
m
, , ,
2 1

.
6!lusi dari persamaan #>' ini, dapat
dihitung dengan "ara menyelesaikan
persamaan 2
? ? K m =
#@'
Misalkan
k
?
adalah eigen:ekt!r
ke-k dari masalah eigen:alue pada
persamaan #>'. .ika semua :ekt!r
F v dilakukan n!rmalisasi, yaitu
harus memenuhi
1 = v v
t
, maka
dengan menggunakan persamaan
#;', #/' dan #@' akan dihasilkan per-
samaan #9'2
=

=
=
m
j i
j
t
i
k
j
k
i
t
x x v v
1 ,
) ( ) (
1 ) = =
k k
k
k t k
K ) ( (
t
#9'
+ntuk mengekstraksi k!mp!-
nen prinsipal, maka semua peta dari
input :ekt!r z ,yaitu ) (z , harus
dipr!yeksikan ke :ekt!r
v
yang telah
din!rmalisasi. +ntuk menghitung pr!-
yeksi tersebut digunakan persamaan 2

=
=
m
i
i
k
i
t
z x k z v
1
) , ( ) ( #1)'
KERNEL PCA UNTUK MASALA*
MULTIKELAS
.U-/AM, KU-UM0PU/.0, 1I+JAJA, M0+IFIKA-I K2.'2L 3 3
ada pembahasan diatas di-
asumsikan input data terdiri dari dua
kelas.+ntuk masalah multikelas , f!r-
mula dan persamaan yang telah di-
bahas diatas perlu disesuaikan. Misal-
kan X himpunan input data dan
banyaknya input data adalah
m

buah. 3impunan input data
X
terdiri
dari
n
buah kelas
n
X X X ,..., ,
2 1
, di-
mana masing-masing kelas terdiri dari
l
n buah elemen.
Misalkan
lk
x menunjukkan elemen
ke k dari kelas ke l . (ungsi
F R
n
: , memetakan semua in-
put data
n
lk
R x ke ruang "eature F.
5erdasarkan hal ini,maka ruang
"eature F untuk masalah multikelas
dibangun !leh kumpulan :ekt!r-:ekt!r
)} ( {
ij
x
, dimana , , 2 , 1 n i = dan
. , 2 , 1
l
n j =
6ehingga semua :ekt!r di
ruang "eature F dapat dinyatakan
sebagai k!mbinasi linier dari :ekt!r-
:ekt!r
)} ( {
ij
x
.
+ntuk setiap pasang kelas
p
dan
kelas
q
, fungsi kernel dinyatakan
dalam bentuk 2
pq ij qj
t
pi qj pi
k x x x x k ) ( ) ( ) ( ) , ( = = .
6edangkan matriks kernel
K
untuk
multikelas dapat dinyatakan sebagai2
] [
pq
K K =
, #11'
dimana
] ) [(
pq ij pq
k K =
,
p
n i ,..., 2 , 1 =
,
q
n j ,..., 2 , 1 =

n p ,..., 2 , 1 = , n q ,..., 2 , 1 =
+ntuk masalah multikelas, matriks
k!:ariansi diruang "eature adalah 2

=
= = =
n
l
lk
t
n
k
lk j
t
m
j
j
x x
m
x x
m
C
l
1 1 1
) ( ) (
1
) ( ) (
1
#12'
6edangkan matriks antar kelas
adalah2
) ( ) (
1
1
l
t
n
l
l l
x x n
m
B

=
=
,#13'
dimana 2
) (
1
) (
1

=
=
l
n
l
ll
l
l
x
n
x
.
%engan telah terbentuknya
matriks k!:ariansi dan matriks antar
kelas , maka seperti halnya dengan
$%&, untuk menyelesaikan masalah
kelasifikasi p!la adalah dengan me-
maksimumkan inersia interkelas dan
meminumkan inersia intrakelas.
r!ses peng!ptimalan tersebut eki-
:alen dengan men"ari s!lusi dari
masalah eigen:alue 2
Bv Cv = #1;'
0arena eigen:ekt!r
v
, yang me-
rupakan s!lusi dari persamaan #1;',
terletak di ruang "eature F maka
eigen:ekt!r
v
dapat dinyatakan se-
bagai k!mbinasi linier dari :ekt!r-
:ekt!r
)} ( {
ij
x
.%engan perkataan
lain ada k!nstanta-k!nstanta
pq

,
n p ,..., 2 , 1 = dan n q ,..., 2 , 1 =
sedemikian sehingga
JU.'AL I'F0.MA/IKA 4 K0MPU/2. '0. 3, JILI+ 5, 2663 ;

=
= =
n
p
n
q
pq pq
p
x v
1 1
) ( #1<'
%engan melakukan substitusi
persamaan-persamaan #12',#13' dan
#1<' ke persamaan #1;' , maka
masalah eigen:alue pada persamaan
#1;' dapat dituliskan sebagai 2
= KWK KK #1/'
atau = WK K , #1>'
dimana
n l l
W W
,.. 2 , 1
] [
=
=
, matriks
)
1
(
l
l
n
diag W =
berukuran
l l
xn n , dan
n p p ,.., 2 , 1
] [
=
=
,
p
n q pq p ,.., 2 , 1
] [
=
=
,
Aigen:alue terbesar dari persamaan
#1/' dapat dihitung berdasarkan
f!rmula (isher 2


=
KK
KWK
/
/
#1@'
Misalkan matriks kernel K di-
k!mp!sisi menjadi
/
QDQ K =
, di-
mana
Q
adalah matriks !rth!g!nal,
:ekt!r k!l!m dari
Q
merupakan
eigen:e"t!r dari matriks
K
, dan
D

adalah matriks diag!nal dengan
elemennya merupakan eigen:alue
yang bersesuaian .
.ika matriks
/
QDQ K =
disub-
stitusikan ke persamaan #1@' akan di-
dapatkan bentuk2


=


=


=


=
/
/ /
/ / /
/ / / /
/ / / /
/ / / /
/
/
) ( ) (
) ( ) (
) ( ) (
) ( ) (
WQ Q
DQ DQ
DQ WQ Q DQ
DQ Q Q DQ
DQ WQ Q DQ
KK
KWK
, dimana
=
/
DQ
#19'
6elanjutnya jika persamaan #19'
dan matriks
/
QDQ K = disubstitusi-
kan ke persamaan #1>' , maka akan
dihasilkan persamaan eigen:alue
dalam bentuk 2
= WQ Q
/
#2)'
%ari persamaan #2)' ini , dapat
dihitung eigen:ekt!r . 6elanjutnya
untuk menghitung :ekt!r

, diguna-
kan persamaan #19' yang dapat di-
nyatakan sebagai
=
/
QD #21'
6elanjutnya :ekt!r

din!rmali-
sasi sedemikian sehingga
1 = v v
t
.
1 ) ( ) (
1 1 1 1 1 1
= =

=



=
= = = = = =
K K x x v v
t
l
l
p
n
p
n
l
lk
n
p
n
q
pq
t
lk pq
n
l
n
k
t
l
p
l
#22'
ersamaan #22' menyatakan bah,a
untuk men!rmalisasi :ekt!r
v
, dapat
dilakukan dengan "ara membagi
:ekt!r

dengan
K
t
.
%engan telah didapatkannya
:ekt!r
v
di F , maka untuk meng-
ekstraksi k!mp!nen prinsipal, semua
peta dari input :ekt!r z , yaitu ) (z ,
harus dipr!yeksikan ke :ekt!r
v
.
.U-/AM, KU-UM0PU/.0, 1I+JAJA, M0+IFIKA-I K2.'2L 3 <
+ntuk menghitung pr!yeksi tersebut
digunakan persamaan 2

=
= =
n
p
n
q
pq pq
t
p
z x k z v
1 1
) , ( ) ( #23'
EKSPERIMEN
+ntuk mengetahui kinerja
M0-&, dilakukan pengujian dengan
data ar!ma yang dimiliki !leh
$ab!rat!ium 0e"erdasan 0!mputasi-
!nal +ni:ersitas Bnd!nesia. %ata
ar!ma yang digunakan terdiri dari 3
jenis ar!ma A, B dan C , setiap jenis
ar!ma terbagi atas / kelas. em-
bagian setiap jenis ar!ma menjadi /
kelas ini berdasarkan pada k!n-
sentrasi alk!h!l yang di"ampurkan ke-
dalam masing-masing ar!ma tersebut.
0!nsentrasi alk!h!l pada masing-
masing ar!ma adalah )C, 1<C, 2<C,
3<C, ;)C dan >)C. 6ehingga t!tal
ar!ma yang akan diklasifikasikan ter-
diri sebanyak 1@ kelas. +ntuk masing-
masing kelas tersedia 2)) data ber-
dimesi @. .enis ar!ma selengkapnya
dapat dilihat pada table.1. 5anyaknya
data training ,yang digunakan dalam
setiap per"!baan , adalah 1)C, 1<C,
2)C, 2<C, 3)C, 3<C, ;)C, dan <)C
dari data yang ada dari setiap kelas.
6edangkan data yang tersisa , untuk
setiap kelas, digunakan sebagai data
testing.
engujian dibagi atas 3 tahap pe-
ngujian 2
1). engujian dilakukan sebanyak 3
kali yaitu pengujian terhadap
ar!ma A,B dan C, yang masing-
masing terdiri dari / kelas. +ntuk
masing-masing pengujian pada
setiap jenis ar!ma , M0-& akan
mengkelasifikasikan ar!ma ber-
dasarkan kelas yang ada di ar!ma
tersebut.
2). engujian dilakukan sebanyak 3
kali yaitu untuk setiap pasang
ar!ma yang berbeda AB, AC dan
BC, yang masing-masing melibat-
kan 12 kelas . +ntuk setiap pe-
ngujian akan dilihat kemampuan
M0-& untuk mengkelasifikasi-
kan ar!ma berdasarkan jenis
ar!ma dan kelas yang ada di
ar!ma tersebut.
3). engujian dilakukan sebanyak 1
kali yaitu semua data jenis
ar!ma A,B, &an C dikumpulkan
menjadi satu. engujian ini me-
libatkan 3 jenis ar!ma dengan
banyaknya kelas ada 1@ buah.
ada pengujian ini akan dilihat
kemampuan M0-& untuk
mengkelasifikasikan ar!ma ber-
dasarkan jenis ar!ma dan kelas
yang ada di ar!ma tersebut.
6ehingga t!tal pengujian yang di-
lakukan sebanyak > kali.
(ungsi kernel yang digunakan
dalam per"!baan ini adalah kernel
75( dengan parameter sigma 2 dan
0ernel !lin!mial berderajat ;. 0inerja
dari met!de M0-& diukur berdasar-
kan kemampuan untuk mengklasi-
fikasikan data pengujian pada kelas
yang tepat. 3asil dari per"!baan
dapat dilihat pada tabel 2
JU.'AL I'F0.MA/IKA 4 K0MPU/2. '0. 3, JILI+ 5, 2663 /
/abel 1. 7asil dari per,obaan
ersentase pengenalan data ar!ma
*ahap %ata &r!ma 0ernel %engan menggunkan data training sebanyak 2
7ata-
rata
1)C 1<C 2)C 2<C 3)C 3<C ;)C <)C

1. & # /kelas' !lin!mial /@,33 @2,22 @3,33 @;,/> @<,)) @),)) 92,92 9),)) @3,31
75( /@,33 @2,22 @3,33 @;,/> @<,)) @),;@ 92,92 9),)) @3,3>
5 # /kelas' !lin!mial @<,)) @<,</ 91,/> 92,/> 9/,11 93,@1 9>,92 9>,33 92,<1
75( @<,)) @<,</ 91,/> 92,/> 9/,/> 9;,>/ 9@,33 9@,)) 92,@3
- # /kelas' !lin!mial >/,/> @3,33 @/,/> @/,)) 91,11 @2,@/ 92,92 92,/> @/,<3
75( >@,33 @3,33 @>,<) @/,)) 9),</ @3,33 92,92 92,33 @/,>9
2.
&5
#12kelas' !lin!mial >9,1> >@,33 @3,>< @>,)) 9),</ 9),9< 92,92 9;,<) @>,1<
75( @),)) >@,@9 @;,1> @/,/> 91,39 91,;3 93,13 9;,@3 @>,</

&-
#12kelas' !lin!mial >/,/> >3,33 @),@3 @3,/> @>,<) @;,<2 9),;2 93,)) @3,>;
75( >/,/> >3,@9 @),@3 @3,/> @>,22 @;,>/ 9),;2 93,)) @3,@1

5-
#12kelas' !lin!mial @1,/> >;,;; @<,)) @>,33 @9,;; 9),2; 93,<; 9<,@3 @>,19
75( @2,<) ><,</ @/,2< @@,33 9),)) 9),9< 93,9/ 9/,1> @>,9/
3.
&5-
#1@kelas' !lin!mial >2,>@ >>,); @1,11 @9,>@ @@,1< @@,>3 @>,<) 91,)) @;,<1
75( >3,@9 >>,;1 @1,/> @9,>@ @@,33 @@,>3 @>,3/ 91,22 @;,@)
PENUTUP
5erdasarkan hasil hasil
per"!ba-an , M0-& dengan
menggunakan fungsi 0ernel 75(
akan memberikan hasil yang lebih
baik dibandingkan dengan
menggunakan fungsi 0ernel
!lin!mial. %isamping itu adanya ke-
"endrungan memberikan hasil yang
meningkat ,jika data training yang di-
gunakan makin meningkat, hal ini ber-
beda dengan kernel !lin!mial yang
memberikan hasil yang berfluktuasi.
5erdasarkan banyaknya data training
yang digunakan , M0-& akan mem-
berikan hasil yang sangat baik jika
digunakan data training lebih dari ;)C
dari data yang tersedia.ada per-
"!baan ini , parameter yang terdapat
pada fungsi kernel, sudah dipilih yang
!ptimal dari semua nilai yang mungkin
dari parameter tersebut.
DAFTAR PUSTAKA
5. 0usum!putr! D 3erry, 2))2 .
Kinerja PNN-Teroptimasi Ber-
basis Algoritma Genetika
Dalam Pengenalan Aroma Dua
Campuran. r!siding 6100 BBB.
.akarta.
5. 0usum!putr! et al , 2))2, Fuzz-
Neuro !F" an# its Comparison
$it% Fuzz Algorit%m !F" in
Arti&icial '#or Discriminat
(stem, B6& *ransa"ti!ns.
.U-/AM, KU-UM0PU/.0, 1I+JAJA, M0+IFIKA-I K2.'2L 3 >
B.*. .!llife. 19@/. Principal
Component Analsis. 6pringer-
Verlag. 1e, E!rk.
0. (ukunaga.199). )ntro#uction to
statistical Pattern *ecognition .
&"ademi" ress, Bn".
V.1. Vapnik .1999. T%e Nature o&
(tatistical !earning T%eor+
6pringer-Verlag. 5erlin.
F..atmik! D 5. 0usum!putr!, 2))1,
Pen$enalan Aroma *ampuran
den$an P'' Pada -istem
Pen,iuman 2lektronik,.urnal Blmu
0!mputasi dan *ekn!l!gi
Bnf!rmasi,:!l121,.akarta.
GGGGGGGGG. 2))1. Karakteristik
(istem Penciuman ,lektronik
Dalam mengenal Aroma
Campuran #an Aroma Kom-
posisi -enggunakan Algoritma
.aringan Neural Buatan. :!l 122.
.akarta.
H.7ustam, 5. 0usum!pura, ,
5.Fidjaya. 2))3. Kelasi&ikasi
Aroma -ultikelas #engan
-enggunakan (/-. r!siding
6eminar 1asi!nal Bntelejensia
0!mputasi!nal dan *ekn!l!gi
Bnf!rmasi. ; &gustus 2))3. B*6.
6urabaya.
JU.'AL I'F0.MA/IKA 4 K0MPU/2. '0. 3, JILI+ 5, 2663 @

Anda mungkin juga menyukai