Pattern Recognition
Feature Selection
Team Teaching
Dasar Pengenalan Pola 2
1. The Design Cycle
2. Collect Data
3. Object to Dataset
4. Feature Selection Using PCA
– Menghitung Eigen Value
– Menghitung Eigen Vector
– Transformasi Data Fitur
– Menghitung Nilai Error
The Design Cycle
Apa sensor yang harus kita gunakan?
Collect data Bagaimana mengumpulkan data?
Bagaimana mengetahui fitur apa yang dipilih,
Choose features dan bagaimana kita memilihnya ...?
(Misal transformasi data fitur dengan PCA)
Apa classifier yang akan digunakan?
Choose model Apakah ada classifier yang terbaik ...?
a1 b1
a b2
x 2
...
reduce dimensiona lity y
...
K N
a
N bk
Dimensionality Reduction
• Pendekatan klasik untuk menghitung transformasi
linier yang optimal adalah Principal Components Analysis
(PCA): mencari proyeksi yang menyediakan informasi
sebanyak mungkin dalam data dengan pendekatan least-
squares.
x1 x2 ... xM x i
x i 1
M M
• Langkah 2: Menghitung Zero Mean
i xi x
Feature Selection Using PCA
• Langkah 3: Membangun matriks Covarians
dengan mengalikan matriks Zero Mean dengan
transposenya
– Populasi
M
1
C
N
i i
T
i 1
– Sampel
1 M T
C
N 1 i 1
i i
Feature Selection Using PCA
• Langkah 4 : Menghitung eigenvalue dari C
CU U det( I C ) 0
I CU I U 1 0 .... 0 c1,1 c1,2 .... c1,n
CU I U 0
....
2
....
....
....
0
....
c 2,1
....
c 2,2
....
....
....
c 2,n
....
( I C ) U 0 0 0 .... N c m,1 c m,2 .... c m,n
• Hasil : 1 , 2 , 3 , ... , N
Feature Selection Using PCA
• Langkah 5 : Menghitung eigenvektor
– Dari eigenvalue yang dihitung pada langkah 4,
disubstitusikan ke rumus :
( I C ) U 0
• Hasil : u1 , u2 , u3 , ... , u N
Feature Selection Using PCA
• Langkah 6 : Mengurangi dimensi sebesar K
dimensi
– Pilihlah fitur sebanyak K berdasarkan nilai eigenvalue
terbesar
K
xˆ x b u
i 1
i i where K N
i 1
i
N
Threshold (e.g., 0.9 or 0.95 )
i 1
i
• Mean global
x1
P11 P21
Banyak _ Data
x2
P12 P22
• Zero Mean Banyak _ Data
x1 x 2 P11 x1 P12 x 2 4 2
D , misal
x1 x 2 P21 x1 P22 x 2 1 5
• Kovarian T
1 4 2 4 2 1 17 13 17 13
C
N 1 1 5 1 5 2 1 13 29 13 29
PCA : Menghitung Eigen Value
• Eigen Value :
detI C 0 1, 2
b b 2 4ac
2a
1 0 17 13
det * 13 29 0 ( 46) 46 2 4 *1* 324
0 1 1, 2
2 *1
17 13 46 2116 1296
det
13 29 0 1, 2
2
17 ( 29) 13 * 13 0 1, 2
46 820
17 ( 29) 169 0 2
46 28.63564
29 17( 29) 169 0 1 8.68218
2
2 29 17 493 169 0 2
46 28.63564
37.31782
2
2 46 324 0
8.68218 0
Matrik Eigen Value
0 37.31782
PCA : Menghitung Eigen Vector
• Eigen Vector :
8.68218
Matrik Eigen Value
0 (c11 )u1 c12u2 0
0 37.31782
c21u1 (c22 )u2 0
CU U
17 13
c11 c12 u1 u1 Matrik kovarian : C
13 29
c
21 c22 u2 u2 Vektor eigen didapatkan dengan
1 0 c11 c12 u1 1 0 u1 persamaan :
0 1 c
21 c22 u2 0 1 u2 (17 )u1 13u2 0
c11 c12 u1 1 0 u1 13u1 (29 )u2 0
c
21 c22 u2 0 1 u2 Untuk λ1 = 8.68218 maka :
0.5389
U
0.8423
PCA : Transformasi x
• Tentukan nilai K dengan 75%
informasi data yang kita gunakan
• Dari nilai K yang ditentukan akan
diperoleh fitur yang dijadikan sebagai
proses pengenalan pola
• λ1 + λ2 = 8,68218+ 37,31782 = 46
• 75%*46 = 34,5
• Jumlahkan semua nilai lamda dimulai dari
yang paling besar, hingga lebih sedikit dari
34,5.
• Vektor eigen yang sesuai dengan nilai
eigen terpilih ini yang digunakan di proses
transformasi nilai fitur
• Dalam kasus ini, yang terpilih hanya λ2
Selesai