Pengenalan pola merupakan bidang dalam pembelajaran mesin dan dapat diartikan sebagai
"tindakan mengambil data mentah dan bertindak berdasarkan klasifikasi data". Dengan
demikian, ia merupakan himpunan kaidah bagi pembelajaran diselia (supervised learning).
Ada beberapa definisi lain tentang pengenalan pola, di antaranya:
Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa kategori.
Suatu pengenalan secara otomatis suatu bentuk, sifat, keadaan, kondisi, susunan tanpa
keikutsertaan manusia secara aktif dalam proses pemutusan. [5]
Berdasar beberapa definisi di atas, pengenalan pola bisa didefinisikan sebagai cabang
kecerdasan yang menitik-beratkan pada metode pengklasifikasian objek ke dalam klas - klas
tertentu untuk menyelesaikan masalah tertentu.
Ada 3 teori dalam pengenalan pola citra:
Teori template
Teori Feature
Teori Struktural
Teori template
Teori Feature
Teori Struktural
Machine Vision
Pengenalan pola menjadi dasar dari sistem mesin ini. Mesin ini menangkap sebuah atau
sekelompok object dengan kamera dan selanjutnya dianalisa untuk di deskripsikan object
atau benda tersebut
Salah satu area pengenalan pola yang secara umum menangani permasalahan otomatisasi dan
informasi. Sistem OCR mempunyai front end device yang terdiri dari pembangkit cahaya,
lensa scan, document transport dan sebuah detektor.
Speech recognition
Pengenalan pola suara salah satu aplikasi yang berkembang saat ini. Sistem ini mengijinkan
kita untuk berkomunikasi antara manusia dengan memasukkan data ke computer.
Meningkatakan efisiensi industri manufaktur, mengontrol mesin dengan berbicara pada mesin
itu.
Kualitas dari suatu vector fitur dilihat dari kemampuannya membedakan objek
yang berasal dari kelas yang berbeda beda. Objek dalam kelas yang sama
haruspunya nilai vektor fitur yang sama dan objek yang berada dalam kelas
yangberbeda harus punya nilai vektor fitur yang berlainan pula. Sifat-sifat dari
fitur,linear/non-linear
separability,
korelasi
dan
modalitas
sangat
penting
untukmenentukan sistem pengenal yang cocok. Berbagai sifat fitur yang penting
Tugas dari pemilah adalah untuk menyekat ruang fitur kedalam daerah-daerahas (Gb.XX). Garis batas
antar daerah keputusan disebutGambar 5.8 Daerah kelas dan 5 Tyang dilabeli dengan
kelsebagai perbatasan keputusan. Pemilahan vektor fitur x meliputi penentuandaerah
keputusan yang sesuai dan pengelompokan x kedalam kelas ini Pemilahdapat diwujudkan
sebagai sekumpulan fungsi diskriminan Dalam contoh diatas, pemilah menentukan vektor
fitur x ke dalam kelas i jika g i ( x ) >g j (x ),i j
5. Metode Clustering
Clustering
adalah
suatu
metode
pengelompokan
berdasarkan
ukuran
Metode Clustering
Metode lain untuk optimasi centroid atau lebar cluster : Genetik Algoritma (GA)
Dalam makalah ini dibahas beberapa teknik clustering hirarki agglomerative yaitu metode
single linkage (jarak terkecil atau tetangga terdekat), complete linkage (jarak terjauh) dan
average linkage (jarak rata-rata). Teknik clustering hirarki agglomerative bekerja dengan
sederetan dari penggabungan yang berurutan atau sederetan dari pembagian yang berurutan
dan berawal dari objek-objek individual. Jadi pada awalnya banyaknya cluster sama dengan
banyaknya objek. Objek-objek yang paling mirip dikelompokkan, dan kelompok-kelompok
awal ini digabungkan sesuai dengan kemiripannya. Sewaktu kemiripan berkurang, semua
subkelompok digabungkan menjadi satu cluster tunggal. Hasil-hasil dari clustering dapat
disajikan secara grafik dalam bentuk dendrogram atau diagram pohon. Cabang-cabang dalam
pohon menyajikan cluster dan bergabung pada node yang posisinya sepanjang sumbu jarak
(similaritas) menyatakan tingkat di mana penggabungan terjadi. Dalam makalah ini diberikan
juga
langkah-langkah
dalam
algoritma
clustering
hirarki
agglomerative
untuk
mengelompokkan N objek (item/variabel). Input untuk algoritma metode linkage bisa berujud
jarak atau similarities antara pasangan-pasangan dari objek-objek. Kelompok-kelompok
dibentuk dari entities individu dengan menggabungkan jarak paling pendek atau similaritas
(kemiripan) yang paling besar.
Input untuk algoritma single linkage bisa berujud jarak atau similarities antara pasanganpasangan dari objek-objek. Kelompok-kelompok dibentuk dari entities individu dengan
menggabungkan jarak paling pendek atau similarities (kemiripan) yang paling besar. Pada
awalnya, kita harus menemukan jarak terpendek dalam D = {dik} dan menggabungkan objekobjek yang bersesuaian misalnya, U dan V , untuk mendapatkan cluster (UV). Untuk langkah
(3) dari algoritma di atas jarak-jarak antara (UV) dan cluster W yang lain dihitung dengan
cara d min{ d d } (UV )W UW, VW = (1) Di sini besaran-besaran dUW dan dVW berturut-turut
adalah jarak terpendek antara cluster-cluster U dan W dan juga cluster-cluster V dan W .
Complete linkage memberikan kepastian bahwa semua item-item dalam satu cluster berada
dalam jarak paling jauh ( simila ritas terkecil) satu sama lain. Algoritma aglomerative pada
umumnya dimulai dengan menentukan entri (elemen matriks) dalam D = {dik} dan
Average linkage memperlakukan jarak antara dua cluster sebagai jarak rata-rata antara semua
pasangan item-item di mana satu anggota dari pasangan tersebut kepunyaan tiap cluster.
Mulai dengan mencari matriks jarak D = {dik} untuk memperoleh objek-objek paling dekat
( paling mirip) misalnya U dan V . Objek objek ini digabungkan untuk membentuk cluster
(UV). Untuk langkah (3) dari algoritma di atas jarak-jarak antara(UV) dan cluster W yang lain
ditentukan oleh (UV ) = (3) di mana dik adalah jarak antara objek i dalam cluster (UV) dan
objek k dalam cluster W , dan Nuv dan Nw berturut-turut adalah banyaknya item-item dalam
cluster (UV) dan W.
Hitung tingkat kesamaan (dengan Eucledian) antara input data dan weight dari input
data tersebut dan pilih input data yang memiliki kesamaan dengan weight yang ada
(data ini disebut dengan Best Matching Unit (BMU))
Perbaharui weight dari input data dengan mendekatkan weight tersebut ke BMU
dengan rumus:
Wv(t+1) = Wv(t) + Theta(v, t) x Alpha(t) x (D(t) Wv(t))
Dimana:
o
Theta (v, t): Fungsi neighbourhood yang tergantung pada Lattice distance
antara BMU dengan neuron v. Umumnya bernilai 1 untuk neuron yang cukup
dekat dengan BMU, dan 0 untuk yang sebaliknya. Penggunaan fungsi
Gaussian juga memungkinkan.
Tambah nilai t, sampai t < Lambda, dimana Lambda adalah jumlah iterasi
Algoritma Rock
Neighborhood Clustering
Sequence Clustering
Spectral Clustering
Latent Class Cluster Analysis a.k.a. Latent Profile Analysis a.k.a. Mixture Model for
Continuous Variabel
Analisa Faktor
Similarity Measure
Feature Discretisation
Feature Selection
Feature Scaling
Pertama akan kita bahas dulu metode cluster secara statistic untuk non hirachical
method yaitu: K-Means Clustering
Algoritma:
1. Partisi item menjadi K initial cluster
2. Lakukan proses perhitungan dari daftar item, tandai item untuk kelompok yang mana
berdasarkan pusat(mean) yang terdekat (dengan menggunakan distance dapat
digunakan Euclidean distance).Hitung kembali pusat centroid untuk item baru yang
diterima pada cluster tersebut dari cluster yang kehilangan item.
3. Ulangi step 2 hingga tidak ada lagi tempat yang akan ditandai sebagai cluster baru.
Contoh :
Dikethui data sebagai berikut:
Item
Observasi
X1
X2
-1
-2
-3
-2
Langkah pertama:
Cluster
X1
X2
(AB)
5 (1)
2
2
3 1
2
2
(CD)
1 (3)
1
2
2 ( 2 )
2
2
Langkah kedua :
Sejak A dekat pada cluster (AB) dibandingkan pada cluster (CD), maka tidak perlu
ditandai.Lanjutkab perhitungan :
d 2 ( B, ( AB )) ( 1 2) 2 (112 ) 2 10
d 2 ( B, (CD )) ( 1 1) 2 (1 2) 2 9
Sehingga B akan ditandi kembali menjadi anggota baru pada cluster (CD), sehingga
membentuk cluster baru (BCD) maka koordinat dari pusat cluster terupdate sebagai
berikut :
Cluster
X1
X2
(BCD)
-1
-1
Selanjutnya lakukn chek untuk setiap item untuk ditandai kembali. Perhitungan kwadrat
jarak(squared distances) dibarikan sbb:
Cluster
40
41
89
(BCD)
52
Kita lihat setiap item yang baru telah ditandai untuk cluster berdasarkan centroid(pusat)
terdekat maka proses telah dihentikan.Sehingga dengan K=2 cluster maka terbentuk
cluster sebagai berikut : A dan (BCD).
6. PengenalanPolaTerbimbingVersusTakTerbimbing
klasifikasi,
sekumpulan
vector
fitur
dikelompokkan
kedalam
beberapa
Distance(Jarak)
Metode ini dimulai dengan setiap objek dinyatakan sebagai kluster tersendiri.
Kedekatan(jarak) antar kluster dihitung dan kluster yang paling dekat digabung. Kedekatan
pada kluster baru dihitung ulang dan kluster paling dekat digabung lagi. Proses tersebut
dilakukan
secara
berulang
Ada
berbagai
metode
digunakan
untuk
menghitung
8. PengelompokkanBerbasisPartisi(PartisionClustering)
Berbeda dengan metode hirarki yang mengelompokkan objek dengan konsep tree, metode
partisi mengelompokkan objek dengan mencari pusat kluster (clusterseeking). Seluruh objek
akan dipartisi kedalam beberapa kluster dengan setiap kluster memiliki pusat kluster. Salah
satu metode cukup terkenal yang masuk kedalam kategori ini adalah metode K-means.
Teknik yang lainnya adalah algoritma Maximum-distance dan algoritma Isodata.
9. AlgoritmaK-means
K-means mengelompokkan objek menjadi K kluster. Metode akan mencari pusat kluster dan
batas-batas kluster melalui proses perulangan (iterative). Kedekatan atau kemiripan
(similarity) suatu objek dengan objek yang lain atau dengan pusat kluster dihitung dengan
menggunakan jarak.
Daftar Pustaka
Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd
edition), Wiley, New York, ISBN 0-471-05669-3.
^ J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural
Approaches, Wiley&Sons, 1996, ISBN 0-471-13534-8
^ IJCSNS, 2006, ISSN 1738-7906)
^ IJCSNS, 2006, ISSN 1738-7906
^ McGraw-Hill Dictionary of Scientific and Technical Terms (2003)
DISUSUN OLEH :
KELOMPOK 6
ARI
AZHAR
EDY SAPUTRA
ELMI FITRIANI
M.FAHRY
SAHRUDIN
KELAS A
PRODI SISTEM INFORMASI
FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS ISLAM INDRAGIRI TEMBILAHAN
2011 / 2012