Machine Learning
Input Model Output
x1 Klasifikasi,
x2 regresi,
y(x,w)
: clustering,
xD dll
Supervised Learning
• Regresi
– Nilai output ti bernilai kontinu (riil)
– Bertujuan memprediksi output dari
data baru dengan akurat
• Klasifikasi
– Nilai output ti bernilai diskrit (kelas)
– Bertujuan mengklasifikasi data baru
dengan akurat
4
Model Linear
• Model yang umum digunakan untuk menyelesaikan masalah klasifikasi dan
regresi adalah model linear, yaitu model yang merupakan kombinasi linear
dari fungsi basis:
Dimana x = (x1, x2, ..., xD)T adalah variabel input, dan w = (w0, w1, ..., wD)T
adalah parameter, φ(x) adalah fungsi basis, M adalah jumlah total parameter
dari model
• Ada banyak pilihan yang mungkin untuk fungsi basis φ(x), misal fungsi linear,
fungsi polinomial, fungsi gaussian, fungsi sigmoidal, dll
5
Model Linear
Kutukan Dimensi
D3
Model Linear
Pendekatan Nonparametrik
8
Metode Kernel
Fungsi Kernel : Definisi
Metode Kernel
Fungsi Kernel : Contoh
10
Metode Kernel
Fungsi Kernel : Keuntungan
11
Metode Kernel
Fungsi Kernel : Penggunaan
• Radial Basis Function (RBF) networks adalah model linear dimana fungsi basis
berupa radial basis function, yaitu fungsi yang tergantung pada jarak antara
argumennya, yaitu φ(||x-xn||), sehingga modelnya berbentuk:
M
y x=∑ w n ∥x− x n∥
n=1
RBF Networks
Formulasi Masalah Pembelajaran
14
RBF Networks
Formulasi Masalah
15
RBF Networks
Contoh Kasus
Seorang ahli biologi telah melakukan eksperimen sebanyak 7 kali untuk melihat
pertumbuhan bakteri berdasarkan kadar Nitrogen, dan diperoleh kondisi sbb:
Kadar Nitrogen (gram) 3 4 6 7 8 9
Pertumbuhan Bakteri 1 3 4 6 8 8
Solusi:
Dari persoalan diatas diketahui x = {3, 4, 6, 7, 8, 9} , t = {1, 3, 4, 6, 8, 8}, N=6
Selanjutnya fungsi basis radial yang digunakan adalah Gaussian dengan σ = 0.5, yaitu:
φ(||x-xn||) = exp(-||x-xn||2/0.5)
16
RBF Networks
Contoh Kasus
Dengan menggunakan semua data x sebagai pusat fungsi basis radial, maka:
[ ]
1.00 1.05 1.50 2.05 3.08 5.05
1.05 1.00 1.20 1.50 2.05 3.08
P= 1.50 1.20 1.00 1.05 1.20 1.50
2.05 1.50 1.05 1.00 1.05 1.20
3.08 2.05 1.20 1.05 1.00 1.05
5.05 3.08 1.50 1.20 1.05 1.00
RBF Networks
Metode Umum
• Karena ada satu fungsi basis untuk setiap data pembelajaran, maka model
yang terbentuk akan menjadi mahal secara komputasi ketika melakukan
prediksi untuk data baru. Untuk itu dibutuhkan mekanisme untuk
menentukan lokasi pusat fungsi basis yang optimal, antara lain:
– Dipilih secara acak dari data pembelajaran
– Menggunakan algoritma unsupervised learning, misal: metode K-Means
– Pendekatan secara sistematik, misal: metode orthogonal least square
• Setelah jumlah lokasi pusat fungsi basis ditentukan, misal M, maka
parameter bobot dapat ditentukan dengan menggunakan metode least
squares
M
18
RBF Networks
Pemilihan Secara Acak
[ ]
1.00 1.50 5.05
1.05 1.20 3.08
P= 1.50 1.00 1.50
2.05 1.05 1.20
3.08 1.20 1.05
5.05 1.50 1.00
19
RBF Networks
Pemilihan Dengan Unsupervised Learning
2) Dengan memilih rata-rata nilai x, yaitu x = 6.1667, sebagai pusat fungsi basis radial,
maka:
[]
3.50
1.80
P= 1.00
1.09
1.52
2.73
21
22
Orthogonal Least Squares
Penentuan Nilai Bobot
t=Pw+e
[ ]
1 a 1,2 ⋯ a1, N
A= 0 1 ⋮ ⋮ , matrik segitiga atas
⋮ ⋮ ⋱ a N −1, N
0⋯ 0 0
(1) t = S g + e
g = (STS)-1 ST t = D-1 ST t (solusi dengan
metode least squares)
(2) A w = g
A dan g diketahui maka w dapat dicari
dengan substitusi balik
23
Contoh:
s1 = p1
Faktorisasi QR dari:
untuk k =2,... , N :
ik = T
w Ti pk
, 1ik
[ ]
P = 1 5
5 1
wi wi adalah
k −1
s k = p k − ∑ ik si
i=1 [
S = 1 4.6154 ,
5 −0.9231 ] [
A = 1 0.3846
0 1 ]
24
Orthogonal Least Squares
Pemilihan Lokasi Pusat Fungsi Basis
Metode OLS dapat digunakan untuk mendefiniskan lokasi pusat fungsi basis yang
signifikan berdasarkan suatu rasio pereduksi error (error reduction ratio (err)) sbb:
N
t =S g e t t= ∑ g i2 sTi si e T e
T
i=1
N
N T
e e
∑ g i2 sTi si
i =1
e T e=t T t−∑ g 2i sTi si T
=1− T
i=1 t t t t
2 T
g i si si
[err ]i = T
,1i N
t t
Metode OLS akan memilih data pembelajaran yang memiliki nilai err terbesar
pada setiap iterasi sebagai pusat fungsi basis
25
• Diberikan data pembelajaran {xn,tn}, n=1 sd N dan suatu fungsi basis radial φ(.)
• Bentuk matrik koefisien P (semua data dijadikan pusat)
1 yaitu nilai g1
g 1 =g 1i 1
26
Orthogonal Least Squares
Algoritma
j=1
matrik A (αjk), dan solusi least
si T
k t square gk
g i
k =
si T i
k sk
• Pemilihan pusat akan berhenti
i gi 2 si T i
k sk
[err ]
k = Tk jika
t t M
cari
i i
1−∑ [err ] j
[err ]k = max[err ]k , 1iM , i≠i1, ... ,i k −1
k
j=1
dan pilih
sk = sk
i
k dimana 0 < ρ < 1 adalah suatu
gk = g
i k toleransi.
k
i k
jk = jk
27
Regularized OLS
Regularization
t=Pw+e
[ ]
1 a1,2 ⋯ a 1, N
A= 0 1 ⋮ ⋮ , matrik segitiga atas
⋮ ⋮ ⋱ a N −1, N
0⋯ 0 0
(1) t = S g + e
g = (STS + λΙΝ)-1 ST t = D-1 ST t (solusi dengan
metode least squares)
(2) A w = g
A dan g diketahui maka w dapat dicari
dengan substitusi balik
29
Regularized OLS
Pemilihan Lokasi Pusat Fungsi Basis
Metode OLS dapat digunakan untuk mendefiniskan lokasi pusat fungsi basis yang
signifikan berdasarkan suatu rasio pereduksi error (regularized error reduction
ratio - rerr) sbb: N
t t = ∑ g i si si e e
T 2 T T
t = S g e
i=1
N
e e g g = t t −∑ g i si s i
T T T 2 T
N
i=1
T
e e g g
T ∑ g i2 sTi si
i=1
T
= 1− T
t t t t
2 T
g i si si
[ rerr ]i = T
, 1i N
t t
Metode ROLS akan memilih data pembelajaran yang memiliki nilai rerr terbesar
pada setiap iterasi sebagai pusat fungsi basis
30
Regularized OLS
Algoritma
• Diberikan data pembelajaran {xn,tn}, n=1 sd N dan suatu fungsi basis radial φ(.)
• Bentuk matrik koefisien P (semua data dijadikan pusat)
1 yaitu nilai g1
i1
g 1 =g 1
31
Regularized OLS
Algoritma
j=1
matrik A (αjk), dan solusi least
si T
k t square gk
g i
k =
sik T si
k
• Pemilihan pusat akan berhenti
i g si
i 2 T i
k s k
[err ]
k = Tk jika
t t M
cari
i i
1−∑ [err ] j
[err ]k = max [err ] k , 1iM , i≠i1, ... ,i k −1
k
j=1
dan pilih
sk = sk
i
k dimana 0 < ρ < 1 adalah suatu
gk = g
i k toleransi.
k
i k
jk = jk
32
Simulasi
Mackey-Glass Time Series Prediction
a * s (t − τ )
(1 − b) * s (t − 1) + untuk t ≥ τ + 1
s (t + 1) = 1 + s (t − τ )10
0.3 untuk 1 ≤ t ≤ τ
33
Simulasi
Mackey-Glass Time Series Prediction
∑
N
RMSE= MSE= t i − y x i 2
i=1
• Hasil:
– Algoritma OLS memberikan akurasi RMSE sebesar 0.000417
– Algoritma ROLS memberikan akurasi RMSE sebesar 0.000294
34
Simulasi
Mackey-Glass Time Series Prediction
1.6
1.4
1.2
V alu e of Tim e S e rie s
0.8
0.6
0.4
0.2
0 50 1 00 150 200 25 0 300 35 0 40 0 4 50 50 0
Tim e In dex
Ket: garis putus-putus biru adalah fungsi Mackey-Glass, o adalah data pembelajaran, garis
merah adalah prediksi dari ROLS
35
Simulasi
Composit Stock Index Prediction
• Data index saham gabungan (composite stock index) untuk simulasi adalah
data dari Bursa Efek Jakarta
• Fitur yang umum digunakan untuk masalah ini antara lain: moving average
(MA), momentum (M), relative strength index (RSI), stochastic (%K), moving
average of stochastic (%D)
• Model: masalah regresi dengan fitur input berdimensi 6, yaitu [s(t), s(t-1), MA5,
MA10, RSI5, M], dan target adalah bilangan real, yaitu [s(t+1)]
36
Simulasi
Composit Stock Index Prediction
N
RMSE= MSE= ∑ t i − y x i 2
i=1
• Hasil:
– Algoritma ROLS memberikan akurasi RMSE sebesar 0.141899
37
Simulasi
Composit Stock Index Prediction
600.00
Composite Stock Index
500.00
400.00
300.00
Jan-01 May-01 Dec-01 May-02 Oct-02
Time Index
Ket: garis putus-putus biru adalah data target, garis merah adalah prediksi dari ROLS
38
Referensi