Anda di halaman 1dari 15

Forum Statistika dan Komputasi, April 2008, p: 7-10 Vol 13 No.

1
ISSN : 0853-8115

PENGGUNAAN JARINGAN SYARAF TIRUAN UNTUK


PENDUGAAN MODEL LINEAR TERAMPAT DENGAN
KOEFISIEN KERAGAMAN KONSTAN
Anik Djuraidah

Departemen Statistika, FMIPA IPB

Abstrak

Secara umum model linear terampat (GLIM) dapat dipetakan secara ekivalen
pada Jaringan Syaraf Tiruan (JST) dengan satu lapisan atau disebut juga
dengan perceptron. Fungsi aktifasi pada JST sama dengan invers dari fungsi
hubung. Pada GLIM dengan komponen acak mempunyai sebaran gamma
ekivalen dengan JST tanpa lapisan tersembunyi dengan fungsi galat adalah
gamma dan fungsi tujuan adalah fungsi kemungkinan maksimum atau devians.
Sedangkan fungsi aktifasi untuk model gamma adalah identitas, resiprokal, atau
eksponensial. Makalah ini mengkaji pendugaan model pada data yang
mempunyai sebaran gamma dengan metode JST dan seberapa besar
perbedaan hasil pendugaannya dibandingkan dengan GLIM. Hasil kajian
menunjukkan bahwa JST menghasilkan nilai dugaan yang sama dengan
GLIM.

Kata kunci : jaringan syaraf tiruan, koefisien keragaman konstan, model


gamma

PENDAHULUAN function) dan sebaran peluang peubah respons dari


keluarga eksponensial. Secara umum model linear
Dalam statistika, jaringan saraf tiruan (artificial terampat terdiri dari tiga komponen (McCullagh
neural network selanjutnya disingkat JST) dan Nelder, 1989, Warner dan Misra, 1996) yaitu :
merupakan suatu kelas yang luas dari model regresi Komponen sistematik atau komponen linear
nonlinear, model reduksi data, dan sistem dinamik i  xi 'β
nonlinear. JST mampu memproses berbagai macam
Fungsi hubung h yang menjelaskan hubungan
data dan membuat prediksi yang kadang kala sangat
antara nilai harapan yi dengan prediktor linear
akurat. h(i )  x i 'β
Pada JST terdapat dua proses yaitu training dan
testing. Proses training pada JST sama dengan Komponen acak dari peubah respon yi yang
metode pendugaan dalam statistika, akan tetapi mempunyai sebaran dari keluarga eksponensial
algoritmanya lebih lambat dibandingkan dengan dengan rataan  dan ragam 2
metode statistika. Sehingga untuk analisis data lebih Pada model yang mempunyai koefisien
disukai menggunakan paket program statistika dari keragaman konstan diasumsikan
pada paket program JST. Sedangkan proses testing Ragam (Yi )   2
E(Yi )   2i
pada JST identik dengan validasi model pada dengan  adalah koefisien keragaman Y. Bila nilai
statistika (Cheng dan Titterington, 1994; Sarle,
 kecil, dapat dilakukan transformasi logaritma
1996). Beberapa model JST identik dengan metode
untuk menstabilkan ragam. Atau bila komponen
statistika antara lain model linear terampat, regresi
sistematik dari model bersifat multiplikatif dapat
polinomial, regresi nonparametrik, komponen diubah menjadi aditif dengan melakukan
utama, analisis diskriminan dan analisis gerombol transformasi logaritma pada data asli dan
(Sarle, 1994; Jordan dan Bishop, 1996). menggunakan metode kuadrat terkecil untuk
Model linear terampat (generalized linear pendugan parameter.
model) merupakan pengembangan model linear
klasik di mana nilaitengah populasi tergantung pada
prediktor linear melalui suatu fungsi hubung (link
1
Penggunaan Jaringan Saraf Tiruan untuk Pendugaan Model Linear
Forum Statistika dan Komputasi
Terampat dengan Koefisien Keragaman Konstan

Bila peubah respon Y berdistribusi gamma lapisan diberi pembobot yang akan
 mentransformasi nilai input menjadi nilai output.
dengan indeks konstan 2 yang bebas terhadap Sedangkan output adalah suatu penjumlahan dari

1

nilaitengah maka fungsi kepekatannya adalah hasil kali antara bobot dengan neuron-neuron pada
  y 
1  y untuk y  0,
 exp  d log lapisan input dan lapisan tersembunyi dengan suatu
f ( y)     fungsi aktifasi tertentu (Sarle,1994; Warner dan
y 
     0,   0
  Misra, 1996).
 untuk lainnya
 Secara umum model linear terampat dapat
 0
Parameter  menentukan bentuk sebaran. dipetakan secara ekivalen pada JST dengan satu
Nilaitengah dan ragam Y adalah lapisan atau disebut juga dengan perceptron (Sarle,
E(Y)  dan Ragam (Y)   /
2
1994). Fungsi aktifasi pada JST sama dengan
 .
Parameterisasi sebaran gamma dalam bentuk invers dari fungsi hubung ( = g-1) (Warner dan
keluarga eksponen menghasilkan parameter Misra, 1996). Untuk model dengan galat menyebar
  1 gamma ekivalensi fungsi hubung pada GLIM

kanonik dan fungsi kumulan dengan fungsi aktifasi tertera pada Tabel 1.
b( )   log( ) Proses training pada JST terbagi dalam tiga
. Sehingga rataannya adalah
tahap utama yaitu : feed-forward, back-propagation,
b'( )  dan fungsi ragam b'( )   2 . Fungsi dan update nilai bobot. Pada tahap feed-forward

hubung kanonik menghasilkan statistik cukup yang dilakukan dari proses input sampai diperoleh
merupakan fungsi
1 linear dari data dinyatakan output, sedangkan tahap back-propagation
 dilakukan perbandingan nilai output dari feed-
sebagai . Selain fungsi hubung kanonik forward dengan nilai target, kemudian dilanjutkan
juga bisa digunakan fungsi hubung logaritma atau ke depan ke lapisan input sehingga diperoleh galat.
identitas (McCullagh dan Nelder, 1989). Pada tahap update dilakukan dilakukan pembaruan
Untuk  yang konstan dan pengamatan yang nilai bobot sampai diperoleh nilai fungsi galat
bebas stokastik dan identik, fungsi log minimal.
kemungkinan maksimum dapat ditulis sebagai
  Tabel 1. Ekivalensi antara Fungsi Hubung dengan
l ( y,  )     log i 
Fungsi Aktifasi
 

i
y

i
i . . . . (1)
Sehingga deviannya adalah Fungsi Hubung Fungsi Aktifasi
D( y, ˆ)  y   yi  ˆ i 
2 log  i Resiprokal Resiprokal
 
   i
ˆ Logaritma Eksponensial
i ˆ i  . . . (2)
Identitas Identitas
Sedangkan penduga kemungkinan maksimum
untuk parameter dispersi
Bentuk feed-forward JST untuk model linear
1 D(6  D) terampat dengan galat menyebar gamma disebut
  (6  2D)
perceptron gamma tertera pada Gambar 1.
Pada tulisan ini akan dikaji pendugaan model Perceptron mempunyai p+1 unit input dengan x0
dengan koefisien keragaman konstan dengan adalah input konstan dan satu unit output. Nilai
metode jaringan syaraf tiruan (JST) dan seberapa input xi diboboti dengan pembobot wi dan jumlah
besar perbedaan hasil pendugaannya dibandingkan input-input terboboti ini kemudian ditransformasi
dengan model linear terampat (GLIM). ˆ
dengan fungsi aktifasi. Nilai output O
dapat dinyatakan sebagai sebuah fungsi f dari nilai
JARINGAN SYARAF TIRUAN UNTIK input x dan bobot wi yaitu :
MODEL DENGAN GALAT MENYEBAR p
ˆ
GAMMA O  f (x, w)  
(w  w x
0 i i
) . . . . (3)
i1

2
Sesuai dengan sistem kerjanya struktur JST dengan x = (x1, . . . , xp) adalah vektor input,
terdiri dari tiga lapisan yang terdiri dari lapisan w = (w1, . . . , wp) adalah vektor pembobot, dan
input (input layer), lapisan antara atau tersembunyi Λ (x) = fungsi aktifasi.
(hidden layer) dan lapisan output (output layer). Pada proses training dilakukan pendugaan
Setiap lapisan terdiri dari beberapa neuron dan antar terhadap bobot wˆ berdasarkan pengamatan
neuron-neuron ini akan dihubungkan dengan  1 1
x ,y   x N , y N  dengan meminimum-kan
neuron lain pada lapisan terdekat. Pada setiap
 
fungsi tujuan (objective function). Bentuk fungsi

3
Penggunaan Jaringan Saraf Tiruan untuk Pendugaan Model Linear Forum Statistika dan Komputasi
Terampat dengan Koefisien Keragaman Konstan

tujuan N
tergant (i)
J (i o(i)z

w  ung
i ˆ w
bentuk ) )
fungsi
galat
(error/c
ost
functio
n).
Fungsi
tujuan
yang
paling
umum
adalah
jumlah
kuadrat
galat,
tetapi
bisa
juga
fungsi
kemungk Pe
inan rmasa
(Warner lahan
dan pada
Misra, traini
1996). ng
Sedangka adala
n h
menurut mini
SAS misasi
Online fungsi
Help v tujuan
8.2 yang
fungsi tergan
tujuan tung
ada tiga, pada
yaitu vektor
kemungk param
inan eter
maksimu adapti
m, f w.
Aspek
pentin
g dari
masal
ah ini
devians, (19 ie
dan 96)ad
pendugaa n
n-M , al
Menu proah
rut sesve
Jorda kt
n dan or
Bisho gr
p ad
3
wJ di evaluasi n
dapat g
training bertujuan secara efisien. a
mendapatkan Minimisasi m
penduga MAP berdasarkan nilai a
(maximum a priori) gradien adalah t
bagi parameter- masalah standar a
parameter dengan dalam optimasi n
memaksimumkan nonlinear, dimana
peluang dari banyak teknik p
parameter- yang sangat a
parameter pada data kuasa. Secara d
D sehingga umum algoritma a
ini diawali
p(w D)) 
p(D || w dengan d
p(w) menentukan nilai a
awal sembarang t
untuk parameter a
w , kemudian
p(D) .. secara iteratif nilai w D
.. diperbarui dengan
.. m
.(
4) e
n
Maksimisasi y
w(r1)  w(r) 
persamaan (4) sama w(r) e
dengan dengan r b
memaksimumkan menunjukkan a
suku pembilangnya r
nomor iterasi.
karena penyebut
Setiap algoritma
tidak tergantung w. b
yang berbeda,
Sehingga e
berbeda pula
maksimisasi b
dalam
persamaan (4) a
memperbarui
ekivalen dengan (r)
s
minimisasi dari w . Metode
negatif logaritma yang terkenal s
suku pembilangnya. antara lain t
Fungsi ini dikenal conjugate o
dengan fungsi galat gradient, quasi- k
kemungkinan, yaitu newton, dan a
untuk kasus s
jumlah kuadrat t
galat, algoritma i
Levenberg- k
J p(D p Marquardt sangat
... efektif. d
( | w) (
... a
w ln w
.. n
)
) (5)
 i
 d
n e
J n
i Input t
k i
w1
a X1 k (ô)
Output Target

m
p
a
w2
X2
e y
wp 4
w0
Nilai respon
Xp
X0≡1:
:
prediktorBias
k
a k
N e
p(w | D)  p( yn | xn , w) m
n1 u
d n
e g
n k
g i
a n
n a
n
y N
n L  ln p( yn | xn ,
w)
a
d n1 .
:
a B
l i
a l
h a

n d
i i
l a
a s
i u
m
t s
a i
r k
g a
e n
t
p
k e
e l
- u
n a
, n
g
s
e a
h w
i a
n l
g
g d
a a
r
f i
u
n p
g a
s r
i a
m
l e
o t
g e
r
5
n
s
e (
r 5
a )
g
a d
m a
p
u a
n t
t
u d
k i
h
s i
e l
m a
u n
a g
k
p a
a n
r .
a
m H
e a
t l
e
r i
n
m i
a
k b
a e
r
s a
u t
k i
u
m
k i
e n
d i
u m
a i
s
p a
a s
d a
a i

p f
e u
r n
s g
a s
m i
a
a g
6
a m
l i
a l
t i
h
s
w p
a Gamba
M (
m r 1.
L w
a Arsitet
ya |
ektur
ng D
d Percept
me
e ma
) ron
n Gamm
ksi .
g a
m
a u
n m
ka
m n
a Setela
k i z
h (n
s menentu
i )
kan
m model 
i probabili
s w
stik,
a fungsi 0
s tujuan, 
i masalah
selanjutn 
f ya adalah
u menemu w
n kan
g prosedur
i
s yang x
i efisien
(n

untuk )
l perhitung
o an
g gradien
(n)
k z dari
e fungsi
m galat.
u Misalkan
n i adalah
g nilai
k output
i dari
n lapisan
a ke-i pada
n pengamat
an ke-n,
y untuk
a model (3)
i karena
t hanya
u satu
lapisan
m maka
e N

7
galat negatif log o
Pada model kemungkinan m
linear terampat pada persamaan b
dengan (1) atau devians i
komponen acak pada persamaan n
mempunyai (2). -
sebaran gamma f
ekivalen r
dengan JST METODE e
tanpa lapisan EVALUAS e
tersembunyi I
dengan fungsi p
i1 . l
a
S Data yang
O adalah s
e digunakan adalah
m
d ˆ output mengenai waktu
( a
a n pengamatan pembekuan
n ) darah dari
(
g McCullagh, and
l
k (
n
a
(
n
ke-n pada model u
(3) adalah 1989 halaman
)
300). Waktu
)

(n)
 pembekuan
darah dalam
Λ(z (n) ) . detik (y) untuk
D
a
Bentuk kanonik plasma normal
t
gradien J(w) diukur pada 9
a
terhadap z macam
adalah persentase
d
konsentrasi
i
prothrombin-free
a
plasma (u) dan 2
n
jenis
a
thromboplastin
l
(lot).
i
Untuk
s
mencapai
a
kelinearan
dilakukan
d
transformasi
e
logaritma pada
n
konsentrasi
g
Penggunaan a
Forum
Jaringan Saraf Statistik n
Tiruan untuk a dan
Pendugaan Model Komput
Linear Terampat asi m
dengan Koefisien e
Keragaman n
Konstan g
g
u
p n
0.020231 0.0239
r a
Fungsi tujuan :
o k
Log likelihood 1.4776439057 -
t a
26.5976
h n
Fungsi tujuan :
r Deviance 0.0016334151
0.0294 8
G g
L a
I l
M a
t
d
a b
n e
r
J d
S i
T s
t
d r
e i
n b
g u
a s
n i

f g
u a
n m
g m
s a
i .

h
u dibandingkan
b H lot2 dengan
u A koefisien arah
n S yang tidak
g I sama. Model
L yang sesuai
( D untuk data ini
a A adalah
k N  1  lot
t P
lot*ln(u)
i E
f M .Dengan
a B fungsi galat
s A menyebar
i H gamma dan
) A fungsi hubung
S resiprokal,
r A nilai penduga
e N parameter dari
s JST dan GLIM
i Plot tertera pada
p data antara Tabel 2. Kedua
r y dengan metode
o konsentrasi menghasilkan
k tertera pada dugaan model
a Gambar 2. yang sama,
l Dari plot yaitu :
tampak Lot-1:
d waktu  1

a pembekuan 0.03677 
n lot1 lebih 0.020231
tinggi 0.15343*ln(

9
u)

0.016554

0.15343*l
n(u)
Lot-2:
 1
 0.03677 
0.020231
0.023599*ln(u)
 0.23908

0.023599*l
n(u)

Gambar 2. Plot antara


Waktu Pembekuan
denganPersentase
Konsentrasi

1
0
1
1
Tabel 2. Nilai Penduga mu
Parameter dari JST dan GLIM ngk
Parameter JST GLIM ina
B
Lot 0 n
e
0.003677 0.0074 ma
r
Lot 1 - ksi
d
0.003677 0.0000 mu
a
Lot 0 * ln(u) m
s
0.015343 0.0015 seb
a
Lot 1 * ln(u) esar
r
0.023599 0.0236 1.4
k
Bias - - 776
a
439
n
057
,
h
bila
a
nila
s
i ini
i
dik
l
alik
p
an
a
den
d
gan
a
ban
yak
T
nya
a
pen
b
ga
e
mat
l
an
2
yait
,
u
p
18,
a
ma
d
ka
a
aka
n
J
dip
S
erol
T
eh
26.
n
597
i
57
l
sam
a
a
i
den
f
gan
u
neg
n
atif
g
log
s
like
i
liho
t
od
u
pad
j
a
u
GL
a
IM.
n
De
mik
k
ian
e
1
2
juga pada dapat L etw
fungsi kemungkinan i ork
tujuan maksimum atau n and
devians, devians. e Stat
bila Ditinjau dari a isti
nilainya kerangka r cal
dikalikan pemodelan Mo
dengan statistik, GLIM M dels
banyaknya memberikan o .
pengamata tata cara yang d Pro
n akan baku daripada e ced
diperoleh JST terutama l din
0.02940 pada tahapan s gs
sama pemilihan . of
dengan parameter, C the
nilai peubah penjelas, h 19t
devians pengujian a h
dari signifikansi p An
GLIM. parameter dan m ual
SA
pemilihan a
S
model terbaik. n
Use
K
r
E a
Gro
S D n
up
I A d Inte
M F rnat
P T H ion
U A a al
L R l Co
A l nfer
N P . enc
U N e.
Model S e S
gamma T w arle
adalah A ,
salah satu K Y WS
bentuk A o .
khusus r 199
dari Cheng, B. & k 6.
jaringan Titterington, . Ne
syaraf D.M. 1994. S ural
tiruan Neural Network a Net
dengan : A review from r wor
bentuk a Statistical l k
arsitekturn Prespective. e and
ya disebut Statistical , Stat
perceptron science 9 : 2-54. W isti
. Fungsi Jordan MI, S
cal
aktifasi Bishop CM. .
Jar
untuk 1996. Neural 1
gon
model Network. AI 9
.
gamma Memo No. 152, 9
[ter
adalah C,B.C.L. Memo 4
. hub
resiprokal, No 131. ung
identitas, Massachusetts Institute of N
e ber
atau Technology. kal
eksponens McCullagh u
r a]
ial, dan P, Nelder JA.
a ftp
fungsi 1989.
tujuannya Generalized l ://f
N
1
3
tp.sas.co
m/pub/n
eural/jar
gon.
Warne
r B, Misra
M. 1996.
Understan
ding
Neural
Network
as
Statistical
Tools.
American
Statisticia
n 50 :
284-293

1
4

Anda mungkin juga menyukai